Parkinson Hastalığının Ses Disfonilerinden Teşhisi için bir Ses Veritabanı Oluşturulması ve Örüntülerinin Kullanımı


İSENKUL M. E. , Erdoğdu B., Şakar O., GÜMÜŞ E. , Delil Ş., Gürgen F., ...Daha Fazla

Tıptekno'11 Tıp Teknolojileri Ulusal Kongresi, Antalya, Türkiye, 13 - 16 Ekim 2011

  • Basıldığı Şehir: Antalya
  • Basıldığı Ülke: Türkiye

Özet

Bu çalısmanın amacı, deneklerden toplanan ses örneklerinden ölçütler çıkarıp disfoniyi tespit ederek, Parkinson hastalarını sağlıklı deneklerden ayırmaktır. Bu amaçla, çalısma kapsamında 21 tanesi Parkinson hastası olmak üzere toplam 41 kisiden ses kayıtları alınmıstır. Her bir denekten alınan 26 farklı ses örneğinden zaman-frekans tabanlı öznitelikler çıkarılmıstır. Bu öznitelikler ayrı ayrı k-en yakın komsu, çok katmanlı algılayıcı ve destek vektör makineleri sınıflandırıcılarına beslenerek sistemlerin Parkinson Hastalığının teshisindeki doğruluk, duyarlılık ve özgüllükleri ölçülmüstür. Bununla birlikte, her hastanın ses örneklerinden çıkarılan öznitelikler maksimum, minimum, ortalama, medyan ve standart sapma merkezi eğilim ölçüleri ile temsil edilmis ve sınıflandırıcılar bu öznitelikler ile de çalıstırılmıstır. Elde edilen sonuçlar, hastalardan alınan farklı ses örneklerinin merkezi eğilim ölçülerinden medyan ve ortalama ile temsil edilmesinin en istikrarlı ve basarılı sonuçları verdiğini göstermistir.

The purpose of this study is to discriminate Parkinson's patients from healthy subjects by determining dysphonia from the extracted measures derived out of the collected voice samples. For this purpose, in the context of this study, variety of voice samples is taken from 41 subjects, 21 with Parkinson disease. Time-frequency-based features are extracted using the 26 different voice samples taken from each subject. These extracted features of each voice sample are fed into k-nearest neighbor, multilayer perceptron and support vector machines classifiers and the accuracy, sensitivity and specificity of the systems for the diagnosis of Parkinson’s disease are proposed. In addition to this, the features that are extracted from the voice samples of each subject are represented by the central tendency measures which are maximum, minimum, mean, median and standard deviation, and the classifiers are run with these representative features. The results show that the most consistent and accurate results are obtained using the mean and median central tendency measures to represent the voice samples of the subjects.