Show simple item record

dc.contributor.advisorÖztürk, Cengizhan
dc.contributor.advisorOtu, Hasan Hüseyin
dc.contributor.authorİşçi, Şenol
dc.date.accessioned2020-12-23T10:38:19Z
dc.date.available2020-12-23T10:38:19Z
dc.date.submitted2013
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/327239
dc.description.abstractHücre içindeki biyokimyasal etkileşimlerin anlaşılmasını hedeeyen yüksek çıktılı biyolojik veriler, en iyi ağ ve patikalar bağlamında analiz edilebilir ve açıklanabilir.Bu veri, genelde gürültü içine gömülü lineer olmayan stokastik ilişkileri temsileder. Bayezyen Ağ teorisi, gen düzenleme ölçümleriyle ilgili verileri analiz etmek içinbir çatı sağlar. Çünkü bu çatı bahsi geçen engelleri doğal olarak ele alır. Bu tezde,altta yatan biyolojik etkileşimleri en iyi açıklayan patikaları bulmak için, bilinen biyolojkpatikaları Bayezyen ağlar olarak modelleyen ve verilen bir mikrodizi deneyininsonuçlarını yansıtan yeni bir yöntem verilmiştir. Bu işlem sırasında, biyolojik patikalar,yönlü çevrimsiz graara dönüştürülür ve gözlenmiş mikrodizi verisinin verilen bir ağane kadar uyduğunu ölçen bir skor hesaplanır. Bu skorların istatistiksel önemi, `önyüklemeile rasgeleleştirme yöntemi` ile değerlendirilir ve uygun patikalar, karşılaştırmaölçüsü olarak kullanılabilecek bir kesinlik ile tespit edilir. Sentetik ve gerçek veri kullanılan simülasyonlar, Bayezyen Patika Analizi (BPA) olarak adlandırılan bu önerilenyöntemin sağlamlığını göstermiştir. Önerilen yöntem, var olan benzer yöntemleregöre gelişme sağlamıştır. Çünkü, bir patikada bulunan genler basitçe bir liste şeklindedüşünülmez ve verilen bir patikadaki hangi genlerin birbiriyle etkileştiğinin topolojisimodelle birleştirilir.Ağ öğrenme teknikleri, altta yatan biyolojik olayları mikrodizi deneyleri yardımıylaortaya çıkarmaya çok yararlı olmasına rağmen, bu ağlar gerçek biyolojik patikalaraçok uzak olabilir. Bunun sebebi, veri içinde genler için az sayıda örnek olmasındandolayı ve uygun olmayan başlangıç ağ yapısı seçiminden kaynaklanan problemlerdir.Öğrenme teknikleri, önceden deneysel testlerle doğrulanmış öncül biyolojik bilgi iledesteklenmelidir. Bilinen genler ve düzenleyici patikalar hakkındaki bilgilerin kullanılması, statik ve dinamik Bayezyen ağların öğrenilmesinin doğruluk ve performansınaen ileri zemini sağlayabilir. Ama, bilindiği kadarıyla, gen etkileşim ağlarında her tip bilgi kaynağından gelen harici öncül bilginin kullanılmasına yönelik genel bir kurulumetodoloji bulunmamaktadır.Bu tezin amaçlarında biri, gen etkileşimlerinin ortaya çıkarılması için hem statikhem de dinamik Bayezyen ağ öğrenme işlemine, bilinen biyolojik bilgileri entegre etmekiçin global bir yaklaşımın kurulmasıdır. Harici biyolojik verilerden faydalanarakiki genin birbiriyle etkileşip etkileşmediğini tahmin etmek için bir çatı önerilmiştir.Buna yönelik olarak, bilinen biyolojik veriyi, gen etkileşimlerinin ortaya çıkarılmasındakullanabilmek adına, var olan biyolojik verilerden Bayezyen ağ üretilmiştir. Kullanılanharici veri tipleri, protein-protein, protein-DNA/RNA ve gen etkileşimlerinden oluş-makta olup, BioGrid ve Reactome gibi etkileşim veritabanlarından elde edilmiştir. lkolarak, bilinen gen etkileşimlerini kullanarak parametre öğrenme yöntemi kullanılarak,verilecek iki genin etkileşip etkileşmediğini tahmin edecek Öncül Bayezyen Ağ (ÖBA)modeli inşa edilmiştir. Elde edilen model, yüksek çıktılı biyolojik veriden ağ öğrenmeiçin greedy arama algoritmasına entegre edilir ve etkileşen genler bir ağ formundasunulur. Bu ağ üretimi işleminde, harici biyolojik veriden etkileşen genleri bulan ÖncülBayezyen Ağ (ÖBA), yapı öğrenme görevinde aday ağların olasılığını hesaplamak içinkullanılır. Hem sentetik hem gerçek veri setleri ile yapılan simülasyonlar göstermiştirki önerilen çatı, gerçek ağların belirlenmesini başarılı bir şekilde geliştirebilir ve genetkileşimlerinin tahmin edilmesinde kullanılabilir.
dc.description.abstractHigh throughput biological data (HTBD) targeting understanding of biochemicalinteractions in the cell can best be analyzed, and explained within the context ofnetworks and pathways. Such data generally represents stochastic nonlinear relationsembedded in noise. Bayesian Network (BN) theory provides a framework to analyzethe data regarding gene regulation measurements, as this framework naturally handlesthe aforementioned obstacles.In this dissertation, we provide a two faceted approach to the applications of BNsto HTBD. In the rst facet, a novel method is provided, which models known biologicalpathways as BNs, and uses given HTBD to nd pathways that best explain underlyinginteractions. During this process, biological pathways are converted to directed acyclicgraphs, and a score measuring tness of the observed HTBD to a given network iscalculated. Statistical significance of these scores is assessed by `randomization viabootstrapping`, and relevant pathways are identied with a certainty that can be usedas a comparative measure. Simulations using synthetic and real data demonstratedrobustness of the proposed approach, called Bayesian Pathway Analysis (BPA). BPAprovides improvement over existing similar approaches by not considering genes in apathway simply as a list, but incorporating to its model the topology via which genesin a given pathway interact with each other. Although network learning techniquesare very useful to reveal the underlying biological phenomena with the help of HTBD,these techniques do not always perform well. This is due to the problems created bythe small number of samples, inconvenient initial choice for the network structures,noise inherent in the data, and the complexity of the networks. To improve theirperformance, the learning techniques can be supported by prior biological knowledge,which are already veried by experimental assays.In the second facet explored in this dissertation, we established a global approachto integrate known biological information to Bayesian learning in order to reveal geneinteractions. The proposed framework makes use of external biological knowledge topredict if two given genes interact with each other. To this end, prior knowledge aboutinteraction of two genes is utilized by generating a Bayesian Network Prior (BNP)model, using existing external biological knowledge. External knowledge types to beutilized were obtained from interaction databases such as BioGrid and Reactome, andconsist of protein-protein, protein-DNA/RNA, and gene interactions. The resultingmodel is incorporated into greedy search algorithm for learning networks from HTBD,and interacting genes are represented in the form of a network. In this process of networkgeneration, the BNP model deducing gene interactions from external knowledgeare used to calculate the probability of candidate networks to enhance the structurelearning task. Simulations on both synthetic and real data sets showed that the proposedframework can successfully enhance identication of the true network, and beused in predicting gene interactions.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBiyoistatistiktr_TR
dc.subjectBiostatisticsen_US
dc.subjectBiyomühendisliktr_TR
dc.subjectBioengineeringen_US
dc.subjectMühendislik Bilimleritr_TR
dc.subjectEngineering Sciencesen_US
dc.titleRevealing gene interactions using Bayesian networks
dc.title.alternativeGen etkileşimlerinin Bayezyen ağlar ile ortaya çıkarılması
dc.typedoctoralThesis
dc.date.updated2018-08-06
dc.contributor.departmentDiğer
dc.identifier.yokid10003256
dc.publisher.instituteBiyo-Medikal Mühendislik Enstitüsü
dc.publisher.universityBOĞAZİÇİ ÜNİVERSİTESİ
dc.identifier.thesisid333114
dc.description.pages110
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess