de novo tüm genom sekans verisi üzerinde gizli Markov modeli tabanlı gen bulma algoritmalarının uygulanması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Nükleotid dizileme teknolojilerindeki gelişime paralel olarak artan genom projesi sayısı, yeni nesil dizileme teknolojilerinin geliştirilmesiyle daha da ivmelenmiştir. Gelişmiş laboratuvar teknikleri sayesinde elde edilen nükleotid dizisi verisinin yine ıslak laboratuvar çalışmaları ile anlamlandırılması çok maliyetlidir. Bu öngörüyle, seksenli yılların başından beri nükleotid dizileri üzerinde hesaplamsal yöntemler ile gen bulmaya yönelik çalışmalar gerçekleştirilmektedir. Bu yöntemlerden gizli Markov modeli tabanlı olanlar, teknik özellikleri ile ön plana çıkmaktadır. Tez çalışması kapsamında, Ankara Üniversitesi Biyoteknoloji Enstitüsü'nde BOREN projesi kapsamında yeni nesil sekanslama yöntemi ile gerçekleştirilen Bacillus boroniphilus genom projesinde elde edilen genom verisi üzerinde, çeşitli gen bulma algoritmaları ve anotasyon akış hatları kullanılarak yapılan gen bulma işlemine ilişkin sonuçlar değerlendirilmiştir. Genom projelerinin dinamik yapısı ve karmaşıklık düzeyi göz önünde bulundurulduğunda, birden fazla yöntemin birbiriyle uyumlu olarak kullanılması gerektiği, ancak gizli Markov modeli tabanlı çekirdek algoritma ve bu algoritmayı kullanan anotasyon akış hattının anotasyonlarının daha güvenilir olacağı gözlenmiştir. Advances in nucleotide sequencing technology has led to faster sequencing of the genomes. Thanks to this advent, even small sized centers can now perform genome projects. Besides the data generation step, one of the key steps in genome sequencing projects is the genome annotation step, which is consisted of `gene finding` and adding attributes to the sequence parts which are most probably coding regions. The need for computational gene finding algorithms is known since 80's, and many gene finding algorithms are developed. In this thesis study, two annotation pipelines (PGAAP, RAST) and their core algorithms which are based on Markov models (GeneMarkS, Glimmer) are used to perform gene finding on de novo genomic sequence of Bacillus boroniphilus, and the results are compared. Because of the dynamic structure and the complexity of genome projects, it can be said that using various methods can be beneficial for obtaining different kinds of information at the post annotation step. It can be said that the method which uses hidden Markov model (GeneMarkS) and the pipeline uses this core algorithm (PGAAP) provided more reliable results for B. boroniphilus genome.
Collections