Geleneksel İç Hastalıkları Günleri İnteraktif Güncelleştirme, Sakarya, Türkiye, 29 Şubat - 03 Mart 2024, ss.27-28
ADRENAL İNSİDENTALOMA İLE İLGİLİ CHATGPT YANITLARININ GÜNCEL KILAVUZLARLA KARŞILAŞTIRILMASI
Elif Ece Dogan, Hülya Hacişahinoğulları, Ümmü Mutlu,
Ayşe Kubat Üzüm, İlhan Satman, Gülşah Yenidünya Yalın
İstanbul Üniversitesi, İstanbul Tıp Fakültesi, İç Hastalıkları Anabilim Dalı, Endokrinoloji ve Metabolizma Hastalıkları Bilim Dalı, İstanbul
Amaç: Adrenal insidentaloma sıklığı, görüntüleme yöntemleri- nin klinik pratikte yaygın olarak kullanılması ile artmıştır. “Chat Generative Pre-trained Transformer” (ChatGPT), birçok kay- naktan elde edilen geniş bir veritabanı ile eğitilmiş büyük bir dil modelidir. Son dönemde tıp alanında öğrencilerin ve hastaların bilgiye erişiminde kolaylık sağlamasından dolayı popüler hale gelmiştir. Bu çalışmanın amacı, adrenal insidentalomalarla ilgi- li internet üzerinde sıkça araştırılan soruları tespit etmek ve bu sorulara ChatGPT’nin verdiği yanıtları değerlendirmektir. Ayrıca ChatGPT’ye adrenal insidentaloma yönetimi ile ilgili temel bazı sorular yönelterek alınan cevapları uluslararası kılavuzlarla kar- şılaştırarak ChatGPT’nin doğruluk ve güvenilirliğini belirlemeyi hedeflemekdir.
Yöntem: Adrenal insidentalomalar ile ilgili, hastaların sık ziyaret ettiği web siteleri ve sosyal medya araçları incelenerek 72 soru oluşturuldu. Bunlardan 37’si tekrarlayan cevaplar, subjektif ya- nıtlar ve kişisel sağlıkla ilgili olduğu için dışlandı. Kalan 35 soru ve uluslararası kılavuzlardan geliştirilen 15 akademik soru, Chat- GPT’ye yönlendirildi. ChatGPT cevapları deneyim süresi >10 yıl olan dört, >2 yıl olan bir endokrinoloji uzmanı ve bir endokri- noloji yan dal asistanı tarafından 1 ile 4 arasında bir puanla de- ğerlendirildi (1: Bilgi tamamen doğru, 2: Bilgi doğru ancak eksik, 3: Bilgi kısmen doğru ancak cevapta yanlış bilgi bulunuyor, 4: Cevap tamamen yanlış bilgi içeriyor).
Bulgular: ChatGPT, sorulara cevap verirken algoritmik bir yak- laşım sergiledi ve vermiş olduğu bu bilgilerin sağlık uzmanı yerine geçmeyeceğini, bireysel sağlık durumları için muhakkak bir sağlık uzmanına danışılmasını önerdi. ChatGPT, 35 genel soruya %9 tam doğruluk oranıyla yanıt verdi. Tamamen yanlış sınıflandırı- lan bir cevabı olmadı. Soruların %51’ine verdiği yanıtlar doğru ancak eksik bilgi içermekteydi. Soruların %40’ında ise yanıtlar doğruydu ancak yanlış bilgi de içeriyordu. Uluslararası kılavuzlara dayalı 15 akademik sorudan sadece %7’si doğru ancak eksik bilgi içeriyordu, %93’ü ise doğruydu ancak yanlış bilgi de içeriyordu. Tamamen doğru veya tamamen yanlış olarak sınıflandırılan bir yanıt olmadı.
Sonuç: Çalışmamız, yapay zekanın özellikle adrenal insiden- talomalarla ilgili genel sorulara yanıt vermede kısmen etkili bir araç olabileceğini göstermektedir. Ancak, bulgular, yapay zeka modellerinin doğruluğunu ve güvenilirliğini, özellikle akademik ve kılavuzlara dayalı konularda arttırmak için çaba sarf edilmesi gerektiğini vurgulamaktadır. Uzmanlarla işbirliği ve sürekli gün- cellemeler, yapay zeka destekli bilgi sağlamanın doğruluğunu ve güvenilirliğini artırmada önemlidir.
Anahtar Kelimeler: adrenal insidentaloma, ChatGPT, yapay zeka