Optimization of weights and features in use of ahp for SNP prioritization
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Tekil Nükleotid Polimorfizmleri (SNP), kanser ya da tip 2 diyabet gibi karmaşık hastalıkların tespitinde umut vadetmektedir. Bununla birlikte karmaşık hastalıklarla ilişkili SNP'lerin tespit edilmesi bireylerin genomlarındaki çok sayıdaki ve değişkenlikteki SNP'ler nedeniyle zorlayıcı bir problemdir. SNP veri setlerinin genom çapında ilişkilendirme çalışmalarında çoğunlukla istatistiksel bulgular üzerinde odaklanılmaktadır. Bununla birlikte, bir insan genomunda yaklaşık yüz milyon SNP bulunmaktadır. İstatistiksel olarak anlamlı SNP'lerle ilgili biyolojik ve işlevsel bilgilerin eklenmesi daha ileri SNP seçimi için önemli özellikler sağlamaktadır. Analitik Hiyerarşi İşleme (AHİ) temelli SNP önceliklendirme tekniği bu görevi yerine getirmek amacıyla geliştirilmiştir. Fakat AHİ'nin uzmanların deneyimlerine ihtiyaç duyması özniteliklerin seçiminde ve ağırlıklarında öznel kararlara neden olmaktadır. Bu çalışmada AHİ tasarımı ve eniyilemesi için Rastgele Orman tabanlı AHİ (RO-AHİ) kategorilerinin ağırlık ve öznitelik belirleme yaklaşımı önerilmektedir. Bu amaçla Prostat Kanseri üzerinde daha önceden yapılmış olan çalışmalar sonucunda geliştirilmiş olan genomik model kullanılmıştır. Geliştirilen yöntem, Şizofreni, Prostat kanseri, Tip 2 Diyabet ve Alzheimer Hastalığı genetik veri setlerinde Delphi AHİ tabanlı bir yöntem ile karşılaştırılmış ve aynı başarıma ulaşılabilmiştir. Ek olarak, RegulomeDB veritabanı da RO-AHİ ye eklendiğinde Şizofreni hastalığı ile ilgili daha iyi sonuçlara ulaşılmış, diğer hastalıklar ile ilgili aynı başarım sonuçlarına ulaşılmıştır. Single Nucleotide Polymorphisms (SNP) holds a promise in identification of genomic footprints of complex diseases such as cancer and diabetes. However identification of SNPs associated to complex diseases is a challenging problem due to the high number and variety of SNPs present in individual genomes. Analysis of genome wide studies of SNP datasets mainly focus on statistical evidence. As there are close to hundred million SNPs in human genome, incorporating biological and functional knowledge about statistically significant SNPs provides valuable features for further selection of SNPs. Analytical Hierarchy Process (AHP) based SNP prioritization approach is a method developed for this purpose. However, AHP requires expert knowledge, which results in subjective decisions. In this work, we propose a novel approach for AHP design and optimization by utilizing Random Forest based AHP (RF-AHP) assessment on categories. We utilized the results of previously developed genomic model on Prostate Cancer. Proposed RF-AHP approach was compared with Delphi-AHP based method on Schizophrenia, Prostate Cancer, Type 2 Diabetes and Alzheimer's disease genomic datasets and same performance was achieved. Additionally, RegulomeDB database was integrated to RF-AHP. While similar performance was obtained in most of the datasets better prioritization scoring is achieved for Schizophrenia disease.
Collections