Viral Yerleşim Bölgelerindeki Karakteristiğin Sınıflandırma Başarımına Etkisi

21. IEEE Sinyal İşleme ve İletişim Uygulamaları Kurultayı, Kıbrıs (Kktc), 1 - 04 Nisan 2013, (Tam Metin Bildiri)

Yayın Türü: Bildiri / Tam Metin Bildiri
Basıldığı Ülke: Kıbrıs (Kktc)
İstanbul Üniversitesi Adresli: Evet

Genetik hastalıkların temel kaynağı vücudumuzun düzgün çalışması için gereken proteinleri kodlayan gen bölgelerindeki bozulmalardır. Gen tedavisi yaklaşımıyla bu bozulmaların gözlendiği bölgeler tespit edilip genetik içeriği değiştirilebilir. Bu bölgeler nükleotit dağılımı açısından özel bir karakteristiğe sahip olup, bu karakteristik genomdaki bilinen istatistiki değerlerin dışında olabilir. Bu çalışmada benzer bir karakteristik tanımlanmış ve bu karakteristiğin genom okumalarının yönünün tahminine (sınıflandırma) etkisi incelenmiştir. Analizlerde kullanılan Kanonik Bağıntı Analizi (KBA) yönteminin iyi bilinen Destek Vektör Makineleri (DVM) yöntemine göre, mevcut okumaları yönlerine göre ayırmada daha başarılı sonuçlar verdiği gözlemlenmiştir.

Main reason of genetic defects is the disorders in gene regions which are responsible for coding the proteins necessary for normal body functions. By gene therapy, the regions with disorders can be detected and their genetic content can be changed for good. These regions may have special characteristics in terms of nucleotide dispersion which are beyond the known statistical norms of genome. In this study, such a characteristic is defined and its effect on predicting the strand direction of genomic reads (classification) is analyzed. By the analyses, it is observed that Canonical Correlation Analysis (CCA) method outperforms well known Support Vector Machines (SVM) approach considering the discrimination of reads according to their strand directions.