Show simple item record

dc.contributor.advisorArslan, Reis Burak
dc.contributor.authorEser, Mithat Ercüment
dc.date.accessioned2020-12-04T13:12:49Z
dc.date.available2020-12-04T13:12:49Z
dc.date.submitted2013
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/86990
dc.description.abstractBiyoenformatik, biyolojik bilginin saklanması, elde edilmesi, organize edilmesi ve analiz edilmesini sağlayan ve iyileştiren bilim dalıdır. Bu sebeple biyoenformatik, moleküler biyoloji için önemli bir hale gelmiştir. Protein dizilimlerinin analizinde kullanılabilecek bir yöntem bunların sınıflandırılması ve yeni bulunan proteinlerin sınıfının belirlenmesini sağlamaktır. Bununla beraber proteinlerin görevlerini temsil eden küçük parçaları olan motiflerin bulunması, protein yapısını ve protein-protein ikişkilerini göstermesi açısından önemlidir.Bu çalışmada, Cohesin protein ailesinin sınıfa özel yüksek özgüllük içeren motifleri çeşitli indirgenmiş aminoasit alfabeleri/gruplamaları ve farklı n-gram uzunlukları ile bulunup J48, Support Vector Machine ve Naïve Bayes ile sınıflandırılmıştır. Sonuçta 5-gram uzunluklu Sdm13 alfabesi ile seçilen 10 özellik ile Naïve Bayes algoritması kullanılarak % 99.09 başarı ile sınıflandırma sağlanmıştır.
dc.description.abstractBioinformatics is an area of science that helps developing and improving methods to store, retrieve, organize and analyze biological data. Thus, bioinformatics has gained important role for molecular biology. One of the methods to analyze this big data is to use classification of protein sequences to predict unseen proteins types. In addition to this, finding motifs, which are a part of protein sequence that contains biological function of the sequence, is important to understand protein structure and protein-protein relationships.In this work, class-specific motifs with high specificity are found and supervised classification models are trained to classify new sequences to find types of cohesin protein using various machine learning algorithms like J48 Decision Tree, Support Vector Machines and Naïve Bayes and with different combinations of Reduced Amino acid Alphabets/Groupings. Results were compared by classification accuracies. Using 5-gram sized Sdm13 alphabet with 10 features and Naïve Bayes algorithm, highest accuracy of 99.09 % is achieved.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.subjectBiyoistatistiktr_TR
dc.subjectBiostatisticsen_US
dc.titleClassification of Cohesin family using class-specific motifs
dc.title.alternativeCohesın ailesinin sınıfa özel motifler ile sınıflandırılması
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentBilgisayar Mühendisliği Anabilim Dalı
dc.subject.ytmMulti classification
dc.identifier.yokid10019794
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityGALATASARAY ÜNİVERSİTESİ
dc.identifier.thesisid373716
dc.description.pages66
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess