Show simple item record

dc.contributor.advisorOğul, Hasan
dc.contributor.authorKalkan, Alper Tunga
dc.date.accessioned2020-12-04T08:41:33Z
dc.date.available2020-12-04T08:41:33Z
dc.date.submitted2012
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/66978
dc.description.abstractDizilim sınıflandırma biyobili?imin en temel problemlerinden bir tanesidir. Ne olduğu bilinmeyen bir moleküler birimi sadece bu birimin dizilim verisi kullanılarak, daha önceden bilinen bir sınıfa atamak için birçok araç ortaya çıkmıştır. Fakatçıkan bu araçların hepsi ilgili olduğu problemler e özeldir. Ayrıca bu araçlar problemin ait olduğu biyolojik dizilim alfabesine bağlıdır. Bu tezde alfabeden bağımsız yeni bir genel dizilim sınıflandırıcı (TRAINER) java programla dili kullanılarak gerçekleştirilmiştir. Bu araç ile kullanıcılar kendi eğitim veri setleri ve kendi dizilim alfabeleri ile dizilim sınıflandırması yapabilecektir. TRAINER kullanıcıların sistemde tanımlı öğreticiyle (supervised) öğrenme yöntemlerinden istediğini, yöntemin parametrelerini ve önceden tanımlı çeşitli özellik belirtme kalıplarından birini seçerek kullanmasını sağlar. Sistemde eğitilmiş modellerkullanıcının isteğine bağlı olarak sisteme ileride tekrar eğitilmeden kullanılmak üzere kayıt edilebilir. Aday efektör tahmini, mikroRNA hedef tahmini ve nükleolar konumlanma sinyal tahmini çalı?maları ile sistemin DNA, RNA ve proteindizilimleri için verimli bir ?ekilde çalıştığı gösterilmi?tir. Ortaya çıkan sonuçların biyolojik manaları tezde tartışılmıştır.
dc.description.abstractClassifying sequences is one of the central problems in computational biosciences. Several tools have been released to map an unknown molecular entity to one of the known classes using solely its sequence data. However, all of the existing tools are problem- specific and restricted to an alphabet constrained by relevant biological structure. Here, we introduce TRAINER, a new online tool designed to serve as a generic sequence classification platform to enable users provide their own training data with any al phabet therein defined. TRAINER is implemented by using java programming language. TRAINER allows users to select among several feature representation schemes and supervised machine learning methods with relevant parameters. Trained models can be saved for future use without retraining by other users. Three case studies are reported for effective use of the system for DNA, RNA and protein sequences; Candidate effector prediction, microRNA target prediction and nucleolar localization signal prediction. Biological relevance of the results is discussed.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.subjectBiyoistatistiktr_TR
dc.subjectBiostatisticsen_US
dc.subjectBiyoteknolojitr_TR
dc.subjectBiotechnologyen_US
dc.titleClassification of short biosequences
dc.title.alternativeKısa biyodizilimlerin sınıflandırılması
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentBilgisayar Mühendisliği Anabilim Dalı
dc.identifier.yokid441663
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityBAŞKENT ÜNİVERSİTESİ
dc.identifier.thesisid316492
dc.description.pages50
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess