Show simple item record

dc.contributor.advisorÇiçek, Abdullah Ercüment
dc.contributor.authorÇaylak, Gizem
dc.date.accessioned2020-12-02T12:26:27Z
dc.date.available2020-12-02T12:26:27Z
dc.date.submitted2019
dc.date.issued2019-10-11
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/33176
dc.description.abstractGenom çapında ilişkilendirme çalışmaları (Genome-Wide Association Studies - GWAS) genetik hastalıkların temelini teşkil eden kalıtsallığın altında yatan sebeplerin sadece bir kısmını açıklayabilmektedir. İki ya da daha fazla lokusun arasındaki epistatik etkileşimler açıklama gücündeki boşluğu kapatmaya yardımcı olduğu gibi kompleks etkileşimleri de tespit ederek kompleks karakterlerin daha iyi çözümlenebilmesi için gelecek vaat etmektedir. Fakat değerlendirilmesi ve hipotez için test edilmesi gereken çok sayıdaki lokus kombinasyonları, hem algoritma karmaşıklığı hem de istatiksel olarak çalışmaları engellemektedir. Sadece ikili etkileşimler göz önüne alındığında dahi bu durum düzelmemektedir. Epistasis önceliklendirme algoritmalarının hem hesaplama yükünü hem de yapılması gereken test sayısını azalttığı kanıtlanmıştır. Güncel metotlar bağlantı dengesizliğinden kaçınmayı ve vaka kohortunu kapsamayı amaçlasa da, metotların hiçbiri seçilen lokusların topolojik düzenini çeşitlendirmeyi amaçlamamıştır. Bu tezde, epistatik testleri önceliklendirmek için iki aşamalı ardışık düzen algoritması önerilmiştir. İlk aşamada çeşitli lokusları seçmek için altmodüler bir fonksiyon optimize edilmiştir.Bu aşama (i) bağlantı dengesizliğinden kaçınmayı ve (ii) birbirini fonksiyonel olarak tamamlayan lokus ikilileri seçmeyi amaçlamaktadır. İkinci aşamada, seçilen lokuslar hızlı epistatik etkileşim tespit eden bir algoritmada girdi olarak kullanılmıştır. Deneylerimizde, metot modern yöntemlerden biri olan LinDen ile Wellcome Trust Case Control Consortium'dan alınan tip 2 diyabet, hipertansiyon, bipolar bozukluk olmak üzere üç veriseti üzerinde karşılaştırılmıştır. Sonuçlar göstermektedir ki epistatik çiftleri bulmak için yapılan testlerin sayısında önemli bir düşüş gözlenirken aynı zamanda keşfedilen istatiksel olarak önemli epistatik çift sayısı da artmıştır.
dc.description.abstractGenome-wide association studies explain a fraction of the underlying heritability of genetic diseases. Epistatic interactions between two or more loci help closing the gap and identifying those complex interactions provides a promising road to a better understanding of complex traits. Unfortunately, sheer number of loci combinations to consider and hypotheses to test prohibit the process both computationally and statistically. This is true even if only pairs of loci are considered. Epistasis prioritization algorithms have proven useful for reducing the computational burden and limiting the number of tests to perform. While current methods aim at avoiding linkage disequilibrium and covering the case cohort, none aims at diversifying the topological layout of the selected SNPs which can detect complementary variants.In this thesis, a two stage pipeline to prioritize epistasis test is proposed. In the first step, a submodular set function is optimized to select a diverse set of SNPs that span the underlying genome to (i) avoid linkage disequilibrium and (ii) pair SNPs that relate to complementary function. In the second step, selected SNPs are used as seeds to a fast epistasis detection algorithm.The algorithm is compared with the state-of-the-art method LinDen on three datasets retrieved from Wellcome Trust Case Control Consortium: type two diabates, hypertension and bipolar disorder. The results show that the pipeline drastically reduces the number of tests to perform while the number of statistically significant epistatic pairs discovered increases.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleDiverse SNP selection for epistasis test prioritization
dc.title.alternativeEpistatik test önceliklendirme için çeşitli SNP seçilimi
dc.typemasterThesis
dc.date.updated2019-10-11
dc.contributor.departmentBilgisayar Mühendisliği Anabilim Dalı
dc.identifier.yokid10277970
dc.publisher.instituteMühendislik ve Fen Bilimleri Enstitüsü
dc.publisher.universityİHSAN DOĞRAMACI BİLKENT ÜNİVERSİTESİ
dc.identifier.thesisid567491
dc.description.pages85
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess