Sağlık Verilerinin Makine Öğrenimi Tabanlı Analizinde Veri Ön İşleme Stratejileri ve Performans Analizinin Rolü


Creative Commons License

Nizam Özoğur H., Orman Z.

9. Türk Tıp Dünyası Kongresi, İstanbul, Türkiye, 19 - 22 Ekim 2023, cilt.1, sa.19, ss.1-5, (Tam Metin Bildiri)

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Cilt numarası: 1
  • Basıldığı Şehir: İstanbul
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1-5
  • İstanbul Üniversitesi Adresli: Evet

Özet

Günümüzde veri miktarının hızla artmasıyla birlikte, makine öğrenimi yöntemleri ve veri analizi, birçok farklı alanda büyük ilgi görmektedir. Ancak gerçek dünya veri setlerinde eksik veriler ve sınıf dengesizliği gibi sorunlar sıkça karşılaşılan zorluklar arasında yer almaktadır. Bu sorunlar, makine öğrenimi modellerinin başarılarını olumsuz etkileyebilir ve modelin yanlış sonuçlar üretmesine neden olabilir. Bu nedenle, veri ön işleme aşamasında eksik verilerin doldurulması ve sınıf dengesizliğinin giderilmesi büyük önem taşır. Özellikle sağlık verileri gibi alanlarda sınıf dengesi, doğruluk ve veri eksikliği gibi faktörler makine öğrenimi yöntemlerinin performansını büyük ölçüde etkileyebilir. Bu çalışma, makine öğreniminde eksik verilere sahip dengesiz veri setlerinde veri ön işleme stratejilerinin ve performans analizinin etkisini araştırmayı amaçlamaktadır. Elde edilen sonuçlara göre sınıf dengesizliği probleminin üstesinden gelinmesinde SMOTE yönteminin sezgisel yöntemler ile birlikte kullanılması etkili olmuştur. SMOTE_PSO yöntemi ile hasta ve sağlıklı bireylerin sınıflandırılmasında %98 duyarlılık metrik sonucu ile oldukça başarılı olduğu görülmüştür.