Adrenal İnsidentaloma İle İlgili ChatGPT Yanıtlarının Güncel Kılavuzlarla Karşılaştırılması

Doğan E. E., Hacişahinoğulları H., Mutlu Ü., Kubat Üzüm A., Satman İ., Yenidünya Yalın G.

Geleneksel İç Hastalıkları Günleri İnteraktif Güncelleştirme, Sakarya, Türkiye, 29 Şubat - 03 Mart 2024, ss.27-28, (Özet Bildiri)

Yayın Türü: Bildiri / Özet Bildiri
Basıldığı Şehir: Sakarya
Basıldığı Ülke: Türkiye
Sayfa Sayıları: ss.27-28
Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu
İstanbul Üniversitesi Adresli: Evet

Özet

ADRENAL İNSİDENTALOMA İLE İLGİLİ CHATGPT YANITLARININ GÜNCEL KILAVUZLARLA KARŞILAŞTIRILMASI

Elif Ece Dogan, Hülya Hacişahinoğulları, Ümmü Mutlu,

Ayşe Kubat Üzüm, İlhan Satman, Gülşah Yenidünya Yalın

İstanbul Üniversitesi, İstanbul Tıp Fakültesi, İç Hastalıkları Anabilim Dalı, Endokrinoloji ve Metabolizma Hastalıkları Bilim Dalı, İstanbul

Amaç: Adrenal insidentaloma sıklığı, görüntüleme yöntemleri- nin klinik pratikte yaygın olarak kullanılması ile artmıştır. “Chat Generative Pre-trained Transformer” (ChatGPT), birçok kay- naktan elde edilen geniş bir veritabanı ile eğitilmiş büyük bir dil modelidir. Son dönemde tıp alanında öğrencilerin ve hastaların bilgiye erişiminde kolaylık sağlamasından dolayı popüler hale gelmiştir. Bu çalışmanın amacı, adrenal insidentalomalarla ilgi- li internet üzerinde sıkça araştırılan soruları tespit etmek ve bu sorulara ChatGPT’nin verdiği yanıtları değerlendirmektir. Ayrıca ChatGPT’ye adrenal insidentaloma yönetimi ile ilgili temel bazı sorular yönelterek alınan cevapları uluslararası kılavuzlarla kar- şılaştırarak ChatGPT’nin doğruluk ve güvenilirliğini belirlemeyi hedeflemekdir.

Yöntem: Adrenal insidentalomalar ile ilgili, hastaların sık ziyaret ettiği web siteleri ve sosyal medya araçları incelenerek 72 soru oluşturuldu. Bunlardan 37’si tekrarlayan cevaplar, subjektif ya- nıtlar ve kişisel sağlıkla ilgili olduğu için dışlandı. Kalan 35 soru ve uluslararası kılavuzlardan geliştirilen 15 akademik soru, Chat- GPT’ye yönlendirildi. ChatGPT cevapları deneyim süresi >10 yıl olan dört, >2 yıl olan bir endokrinoloji uzmanı ve bir endokri- noloji yan dal asistanı tarafından 1 ile 4 arasında bir puanla de- ğerlendirildi (1: Bilgi tamamen doğru, 2: Bilgi doğru ancak eksik, 3: Bilgi kısmen doğru ancak cevapta yanlış bilgi bulunuyor, 4: Cevap tamamen yanlış bilgi içeriyor).

Bulgular: ChatGPT, sorulara cevap verirken algoritmik bir yak- laşım sergiledi ve vermiş olduğu bu bilgilerin sağlık uzmanı yerine geçmeyeceğini, bireysel sağlık durumları için muhakkak bir sağlık uzmanına danışılmasını önerdi. ChatGPT, 35 genel soruya %9 tam doğruluk oranıyla yanıt verdi. Tamamen yanlış sınıflandırı- lan bir cevabı olmadı. Soruların %51’ine verdiği yanıtlar doğru ancak eksik bilgi içermekteydi. Soruların %40’ında ise yanıtlar doğruydu ancak yanlış bilgi de içeriyordu. Uluslararası kılavuzlara dayalı 15 akademik sorudan sadece %7’si doğru ancak eksik bilgi içeriyordu, %93’ü ise doğruydu ancak yanlış bilgi de içeriyordu. Tamamen doğru veya tamamen yanlış olarak sınıflandırılan bir yanıt olmadı.

Sonuç: Çalışmamız, yapay zekanın özellikle adrenal insiden- talomalarla ilgili genel sorulara yanıt vermede kısmen etkili bir araç olabileceğini göstermektedir. Ancak, bulgular, yapay zeka modellerinin doğruluğunu ve güvenilirliğini, özellikle akademik ve kılavuzlara dayalı konularda arttırmak için çaba sarf edilmesi gerektiğini vurgulamaktadır. Uzmanlarla işbirliği ve sürekli gün- cellemeler, yapay zeka destekli bilgi sağlamanın doğruluğunu ve güvenilirliğini artırmada önemlidir.

Anahtar Kelimeler: adrenal insidentaloma, ChatGPT, yapay zeka