dc.contributor.advisor | Süzek, Barış Ethem | |
dc.contributor.author | Karabulut, Onur Can | |
dc.date.accessioned | 2020-12-29T13:08:48Z | |
dc.date.available | 2020-12-29T13:08:48Z | |
dc.date.submitted | 2020 | |
dc.date.issued | 2020-10-20 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/420110 | |
dc.description.abstract | Adenovirüsler, DNA sekansını ve çekirdek proteinlerini çevreleyen karmaşık bir protein kılıfından oluşan büyük virüslerdir. Adenoviridae adlı geniş bir aileye mensupturlar ve birçok omurgalıyı enfekte edebilen yüzlerce üyesi vardır. İnsan, insan olmayan primat, yarasa, kedi, köpek, domuz, koyun ve keçi türleri arasındaki adenovirüslerin bu türler arasındaki geçişleri bilinmektedir. Adenovirüs konakçı özgüllüğünü ve türler arası virüs bulaşma tahminini anlamak, adenovirüslerin neden olduğu enfeksiyonların tedavisinde önemlidir. Bilinen adenovirüslerin yaklaşık elli tanesi insanı enfekte eder ve bazen ciddi, gastrointestinal, solunum, idrar ve kornea enfeksiyonlarına neden olabilir. Enfeksiyonun başlaması için adenovirüsler, tipik olarak bir konakçı hücre reseptörü ve AdV fiber proteini arasında bir bağlanma ile başlatılan, konakçı hücrelerle karmaşık bir etkileşim dizisi oluştururlar. Bu nedenle, reseptör ve lif proteinleri arasındaki protein-protein etkileşimlerini (PPE) anlamak, belirli bir adenovirüsün konakçı özgüllüğünü tahmin etmek için bir model geliştirmeye yönelik önemli bir adımdır. Bu çalışmada amacımız, bir adenovirüsün konak özgüllüğünü tahmin etmek için bir çalışma dizini oluşturmaktır. Bu amaçla, önce bir literatür taraması yapılmıştır ve adenovirüslerin hücre içine alımına katılan tüm insan reseptörleri belirlenmiştir. Daha sonra, diğer adenovirüs konak türlerinden insan reseptör ortologları hesaplanmıştır. Ardından, farklı konak türleri enfekte eden çeşitli adenovirüslerden elde edilen bir lif proteinleri kütüphanesi oluşturuldu. Son olarak, adenovirüslerin konak özgüllüğünü öngören bir meta-sınıflandırıcı geliştirildi. Sınıflandırıcıda kullanılan veri nesneleri, mevcut PPE tahmin yöntemleri, yani VHPPI, HOPITOR ve DeNovo ile konak reseptör-fiber protein etkileşimleri için hesaplanan tahminlerdir. Bu veri nesneleri için, taksonomik düzey türleri, cinsi, ailesi ve takımında aynı taksayı paylaşan aday konak ve adenovirüs'ün bilinen konağına dayalı olarak dört farklı sınıf etiketi hesaplanmıştır. Meta-sınıflandırmada birçok topluluk makinesi öğrenme yaklaşımı test edilmiştir. İstifleme grubu sınıflandırıcıları en iyi doğrulukları vermiştir. İstifleme için J48 karar ağacı, Naive bayes, çok katmanlı algılayıcı, rastgele orman ve destek vektör makinesi algoritmaları test edildi. Sınıflandırıcıların performansı birbirine yakındır ve J48 karar ağacı biraz daha iyi olmuştur (Doğru pozitif oran:% 71.5, doğru negatif oran% 71.5 ve doğruluk % 71.0). Bu çalışmada, adenovirüslerin konak özgüllüğünün öngörülmesinde bir grup PPE tahmin yöntemlerinin kullanılmasının potansiyelini ve doğruluğu gösterilmiştir. Adenoviridae fiber proteininin ve bilinen konak reseptör proteinlerinin çeşitliliği, çalışma dizininin geliştirilmesinde bir zorluk yaşatmıştır. Sonuçlarımız, daha doğru türler arası PPE tahminlerine ihtiyaç olduğunu göstermektedir. Gelecekte, konaklar arası geçişlerin erken tespiti veya adenovirüslerin konak özgüllüğünün değerlendirilmesi için çalışmalarımızın geliştirilebileceğini öngörüyoruz. Ayrıca, yaklaşımımız Adenoviriade dışındaki diğer virüs ailelerine yayılma potansiyeline sahiptir ve bu, özellikle son yıllardaki konaklar arası geçişlerle ilişkili viral hastalık salgınlarındaki artışı göz önüne alındığında, önem teşkil etmektedir. | |
dc.description.abstract | Adenoviruses are large viruses that consist of a complex protein cover enclosing its DNA sequence and core proteins. They belong to a large family called Adenoviridae with over hundred known members that can infect extensive range of vertebrates. The cross-species transmissions of adenoviruses between human, non-human primate, bat, cat, dog, pig, sheep and goat species are known. Understanding adenovirus host specificity and prediction of cross-species virus transmissions are important in the management of infections caused by adenoviruses. Nearly fifty of known adenoviruses infect human and can cause, sometimes serious, gastrointestinal, respiratory, urinary, and corneal infections. For the infection to start, adenoviruses establish a complex set of interactions with host cells, typically initiated by a binding between a host cell receptor and adenovirus fiber protein. Hence, understanding protein-protein interactions (PPIs) between receptor and fiber proteins, is an essential step towards developing a model to predict host specificity of a given adenovirus. In this work, our goal was to create a pipeline to predict host specificity of an adenovirus. For this purpose, we, first, conducted a literature review and identified all human receptors that are involved in the uptake of adenoviruses. Next, we computed human receptor orthologs from other adenovirus host species. Then, we computed a library of fiber proteins from various adenoviruses infecting different host species. Finally, we developed a meta-classifier predicting host specificity of adenoviruses. The data objects used in the classifier were the predictions computed for host receptor-fiber protein interactions by the existing PPI prediction methods, namely VHPPI, HOPITOR and DeNovo. For these data objects, four different class labels were computed based on candidate host and adenovirus's known host sharing the same taxa at taxonomic levels species, genus, family, and order. Several ensemble machine learning approaches were tested in meta-classification. The stacking ensemble classifiers gave the best accuracies. For stacking, we tested J48 decision tree, naïve bayes, multilayer perceptron, random forest, and support vector machine algorithms. The performance of classifiers were close the each other with J48 decision tree being slightly better (True positive rate:71.5%, true negative rate 71.5% and 71.0%). In this work, we demonstrated the potential and accuracy of using an ensemble PPI prediction methods in prediction of host specificity of adenoviruses. The diversity of Adenoviridae fiber and known host receptor proteins posed a challenge in the development of the pipeline. Although our results are quite promising, they also suggest the need for more accurate cross-species PPI predictions. In the future, we anticipate our work can be leveraged and improved for early detection of host shifts or in assessment of host specificity of adenoviruses. Furthermore, our approach has the potential to be extended to other virus families beyond Adenoviriade and this is particularly significant, given the rise in viral disease epidemics involving host shifts in recent years. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/embargoedAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | A computational approach for predicting host specificity of adenoviruses | |
dc.title.alternative | Adenovirüslerin konak özgüllüğünü tahmin etmede kullanılacak bir hesaplama yöntemi | |
dc.type | masterThesis | |
dc.date.updated | 2020-10-20 | |
dc.contributor.department | Biyoenformatik Anabilim Dalı | |
dc.identifier.yokid | 10338825 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | MUĞLA SITKI KOÇMAN ÜNİVERSİTESİ | |
dc.identifier.thesisid | 642255 | |
dc.description.pages | 81 | |
dc.publisher.discipline | Diğer | |