Show simple item record

dc.contributor.advisorAtalay, Mehmet Volkan
dc.contributor.authorBozkurt, Burçin
dc.date.accessioned2020-12-10T11:00:04Z
dc.date.available2020-12-10T11:00:04Z
dc.date.submitted2003
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/254122
dc.description.abstractHesaplanma yöntemleriyle çok hücreli gen dizinleri arasından gen tanıma, son yıllarda popüler bir araştırma konusu olmuştur. Bu konuyla ilgili olarak eski yaklaşımlar, özel fonksiyonel elemanlara, kodlanan ve kodlanamayan DNA'ya odaklanmıştır. Yeni yaklaşımlar birçok tipteki bilginin bütünleşmesini sağlamıştır. Herhangi bir proteinin yapı bilgisi, ilgili proteinin, fonksiyonunu tanımlamada esastır. Ek olarak, bir proteinin hücresel bölgelendirilmesi, protein karakteri ile ilgili bilgi edinmede kullanılır. Bu çalışmada, proteinlerin temel dizi bilgisi kullanılarak hücresel bölgelendirilmesini sağlayan bir yöntem sunulmuştur. Bir proteinin temel dizi bilgisi, amino asit dizilimine dayanmaktadır. Bir proteinde bulunan her amino asitin frekansı hesaplanır ve hesaplanan değer amino asitle ilişkilendirilir. Bir protein, için hesaplanan her değer, biyolojik bilgiyi koruma amaçlı olarak kullanılan kodlama şablonunda kullanılır. Kodlama şablonu Nokta Kabüllü Mutasyon matrisine dayanır. Bu çalışma, çekirdek, cytosolic, mitokon- dri ve signal peptid hücresel bölgelerini tanıma amaçlı tasarlanmıştır. Kümeleme yöntemi olarak Temel Bileşenler Analizi ve Özdüzenlemeli Harita kullanılmıştır. Sınıflandırma yöntemi olarak Destek Vektör Makinaları kuUanılmıştır. Özellik ayırma, kümeleme ve sınıflandırma yöntemlerinin birleştirilmesinin amacı pro tein hücresel sınıflandırılmasını doğru yapan bir tahmin sistemi tasarlamaktır. Üç adet yöntemi birleştiren bu tasarım seri birleşen mimarisine sahiptir. Seri birleşen mimarisinde, bir yöntemin sonucu diğer yönteme girdi olarak kullanılmaktadır. Anahtar Kelimeler: destek vektör makmaları, global protein hücresel sımflandırılması, kümeleme, PAM250
dc.description.abstractThe problem of identifying genes in eukaryotic genomic sequences by compu tational methods has attracted considerable research attention in recent years. Many early approaches to the problem focused on prediction of individual func tional elements and compositional properties of coding and non coding deoxyri bonucleic acid (DNA) in entire eukaryotic gene structures. More recently, a num ber of approaches has been developed which integrate multiple types of informa tion including structure, function and genetic properties of proteins. Knowledge of the structure of a protein is essential for describing and understanding its function. In addition, subcellular localization of a protein can be used to pro vide some amount of characterization of a protein. In this study, a method for the prediction of protein subcellular localization based on primary sequence data is described. Primary sequence data for a protein is based on amino acid sequence. The frequency value for each amino acid is computed in one given position. Assigned frequencies are used in a new encoding scheme that conserves biological information based on point accepted mutations (PAM) substitution matrix. This method can be used to predict the nuclear, the cytosolic sequences, the mitochondrial targeting peptides (mTP) and the signal peptides (SP). For clustering purposes, other than well known traditional techniques, `principle component analysis (PCA)` and `self-organizing maps (SOM)` are used. For classification purposes, `support vector machines (SVM)`, a method of statis tical learning theory recently introduced to bioinformatics is used. The aim of the combination of feature extraction, clustering and classification methods is to design an acccurate system that predicts the subcellular localization of pro teins presented into the system. Our scheme for combining several methods is cascading or serial combination according to its architecture. In the cascading architecture, the output of a method serves as the input of the other model used.Keywords: support vector machines, global protein subcellular localization, clus tering, PAM250en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/embargoedAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titlePrediction of protein subcellular localization using global protein sequence feature
dc.title.alternativeEvrensel protein dizi özelliğinin kullanılarak protein hücresel sınıflandırılmasının tahmini
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentDiğer
dc.identifier.yokid158455
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityORTA DOĞU TEKNİK ÜNİVERSİTESİ
dc.identifier.thesisid143404
dc.description.pages84
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/embargoedAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/embargoedAccess