Show simple item record

dc.contributor.advisorTan, Mehmet
dc.contributor.authorPancaroğlu, Doruk
dc.date.accessioned2021-05-08T11:22:04Z
dc.date.available2021-05-08T11:22:04Z
dc.date.submitted2014
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/683292
dc.description.abstractProtein etkileşim tahmini için ikili sınıflandırmada, mevcut iki adet proteinin negatif(etkileşime girmeyen) olduğunu tespit edebilmek zor bir işlemdir. Bu zorluğunsebeplerinden biri bu sınıflandırmayı yapmaya yardımcı olacak eğitim kümesi içinhiçbir zaman etkileşmeyen örnekleri temin etmenin güç olmasıdır. Ayrıca, bir proteinçiftinin etkileşmediği ispatlanmış olsa bile, protein etkileşim veri tabanlarında bunegatif örneklere yer verilmez. Bu durum sebebiyle gerçek negatif örnek kullanmayanöğrenme algoritmalarına bir ihtiyaç doğmuştur. Bu çalışmada, yüksek performanslarısebebiyle seçilen iki adet pozitif etiketsiz öğrenme algoritması, AGPS ve Roc-SVMiçin geliştirmeler yapılması hedeflenmiştir. Bu algoritmalara iki adet geliştirmeyapılacaktır: algoritmaların sınıflandırma için kullandığı support vector Machines(SVM) sınıflandırıcısı yerine Random Forest sınıflandırıcısını kullanmak (AGPS-RFve Roc-RF) ve iki algoritmayı birleştirerek sonuçlarını bir oylama sistemine sokmak(Karma Algoritma). Bu geliştirmeler yapıldıktan sonra algoritmalar önceki halleri ileve yaygın olarak kullanılan iki adet sınıflandırma algoritması (CLR ve ARACNE) ilekarşılaştırılarak performansları incelenmiştir. Yapılan karşılaştırmalarda, AGPS-RF,Roc-RF ve Karma Algoritma, SVM kullanan seleflerine göre daha iyi performansvermiştir. CLR ve ARACNE ile yapılan karşılaştırmalarda ise Roc-RF ve KarmaAlgoritma'nın daha performanslı olduğu görülmüştür.
dc.description.abstractIn binary classification for protein interaction prediction, labeling two proteins asnegative (not interacting) is a hard task. This problem is caused by the difficulty ofobtaining two training samples that would never interact. Furthermore, the proteininteraction databases do not include negative samples, even if the samples have beenshown to be non-interacting. The aforementioned difficulty in obtaining true negativesamples created a need for learning algorithms that does not use negative samples.This study aims to improve upon two well-performing positive unlabeled learningalgorithms, AGPS and Roc-SVM for protein interaction prediction. Two extensions tothese algorithms is proposed; the first one is to use Random Forests as the classifierinstead of support vector Machines (AGPS-RF and Roc-RF) and the second is tocombine the results of AGPS and Roc-SVM using a voting system (HybridAlgorithm). After these two approaches are implemented, the results were comparedto the original algorithms as well as two well-known learning algorithms, ARACNEand CLR. In the tests and comparisons, both Random Forest algorithms and theHybrid algorithm performed well against the original SVM-classified ones. Theimproved Roc-RF and Hybrid Algorithms also performed well against ARACNE andCLR.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleProtein etkileşim tahmini için pozitif etiketsiz öğrenme algoritmalarının geliştirilmesi
dc.title.alternativeImproving positive unlabeled learning algorithms for protein interaction prediction
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentBilgisayar Mühendisliği Ana Bilim Dalı
dc.identifier.yokid10034924
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityTOBB EKONOMİ VE TEKNOLOJİ ÜNİVERSİTESİ
dc.identifier.thesisid361071
dc.description.pages50
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess