Genetik veri içeren klinik veri tabanlarına yönelik analiz yöntemleri
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Genomik ve bilgisayar teknolojilerindeki gelişmelerin ardından genetik araştırmalarda biyoinformatik disiplininin rolü daha da artmıştır. Karmaşık araştırma sorularının çözümü için yeni veri analiz tekniklerine duyulan ihtiyaç, biyoinformatik profesyonellerinin karşılaştığı en önemli sorundur.Hasta ve kontrol grupları arasındaki allel frekansı farklılıklarını araştırmada en çok kullanılan araştırma tasarımı Genom Çağında İlgi Çalışmalarıdır (GWAS). İlk GWAS araştırması 2005 senesinde gerçekleştirilmiştir ve o zamandan beri gittikçe artan sayıda GWAS araştırması yayınlanmıştır. GWAS, tüm kısıtlılıklarına rağmen vaka ? kontrol temelli genetik araştırmalar için en önemli yöntemlerden birisidir.Genomik verilerin analizi için yakın zamanda önerilen en yeni yöntemlerden birisi de Çok Değişkenli Uzaklık Matrisi Regresyonu'dur (MDMR). MDMR, özellikle bağımsız değişken sayısının olgu sayısına kıyasla çok fazla olduğu durumlar için oldukça güçlü bir analiz yöntemidir. Bireyler arasındaki uzaklıklar hesaplanarak bir bağımlı değişkenler matrisi oluşturulur ve genetik bilgi içeren değişkenler de modele bağımsız değişken olarak eklenebilir. Böylece bağımsız değişkendeki varyasyon miktarı açıklanmaya çalışılır. Yakın zamana kadar, yntemin genetik alanındaki kullanımı gen ekspresyonu verisi ile sınırlı kalmıştır.Bu çalışmada GWAS yaklaşımı ve MDMR yöntemi birlikte bipolar bozukluk veri setine uygulanmıştır. İlk basamakta GWAS yapılarak bipolar hastası bireylerle kontrol olgularını birbirinden ayıran istatistiksel olarak nalamlı SNPler bulunmaya çalışılmıştır. İkinci basamakta ise bipolar bozukluk hastalarına MDMR uygulanmış ve hastalığın seyrine etki etmesi olası fenotip X genotip etkileşimleri incelenmiştir. En son basamakta ise bu iki uygulamanın sonuçları kıyaslanmış ve kesişim SNPleri araştırılmıştır.Bazı kısıtlılıkları olmasına rağmen MDMR yöntemi, genetik faktörlerin kompleks hastalıklara etkisini incelemek için güçlü bir analiz aracıdır. Yöntemin esnekliği hem gen ekspresyonu verisi ile hem de SNP verisi ile genomik araştırmaların yürütülmesine olanak tanımaktadır. Bilindiği kadarıyla bu çalışma MDMR yönteminin fenotip verisi ile oluşturulan uzaklık matrisleri ile ilk uygulamasıdır. Ayrıca yöntem bipolar bozukluk verisi için ilk kez kullanılmaktadır.GWAS ve MDMR analizleri sonucunda toplam 12 SNP ortak olarak bulunmuştur. Bu SNPler hem hastalığın ortaya çıkması hem de seyri açısından önemlidirler. Ayrıca analizler sonucunda istatistiksel anlamlılığı gösterilen bazı SNP ve genlerin önceki araştırmalarda da bipolar bozukluk ile ilişkili olduğu gösterilmiştir.Sonuç olarak, MDMR etkin bir analiz aracıdır ve kısıtlılıkları üzerinde çalışılarak genomik araştırmalarda verimli şekilde kullanılabileceği düşünülmektedir. Following the advances in genomics and computer technologies, the role of bioinformatics in genetic studies dramatically increased. The need for new data analysis techniques to handle complex problems is one of the most challenging tasks that bioinformatics professionals have to deal with.Most frequent study design to compare allele frequency distances between patients and controls is called GWAS (Genome Wide Association Study). Since the first GWAS in 2005, increasing numbers of similar research were published. GWAS has its own strengths and weaknesses and still is a major design for most case ? control genetic research.One of the recent data analysis methods proposed for the analysis of genomic data is Multivariate Distance Matrix Regression (MDMR). MDMR is a statistically powerful tool, especially for the problems where the number of independent variables exceeds the total number of cases. A dependent variable matrix is calculated based on statistical distances between individuals and genetic information is added to the model as independent variables to explain the variation in the distance matrix. Until recently, its use in genetic research was limited with gene expression studies.This study utilizes traditional GWAS approach and MDMR method on a bipolar disorder data set. As the first step, we applied the GWAS technique to determine the statistically significant SNPs those may distinguish bipolar patients and control individuals. In the second step, we applied MDMR model to understand the phenotype X genotype interactions those may affect the disease course in bipolar disorder. As the last step, we compared the outcomes collected in previous steps and determined the overlapping SNPs.Despite several limitations, MDMR is a useful analysis tool, especially for investigating the effects of genetic factors on complex diseases. Flexibility of the method is an advantage as it can be used in both gene expression and SNP based genomic research. To our knowledge, this study is the first MDMR application on phenotype based distance matrices. Moreover, this is the first study to apply the method on bipolar disorder data.A total of 12 SNPs were common in both GWAS and MDMR runs. These SNPs are crucial in terms of both occurrence and course of bipolar disorder. Several SNPs and genes those found to be statistically significant in our analysis were previously reported to be associated with bipolar disorder.As a conclusion, MDMR is a useful tool and it should be tweaked in terms of its limitations so that it can be used more effectively in genomic research.
Collections