Computational approaches to protein structure prediction
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bioinformatik alanında, protein katlanma problemi cüzüm bekleyen problem-lerden birisidir. Burada amaş proteinin uş boyutlu yapısını proteinin amino asitbilgisini kullanarak belirleyebilmektir. Bir proteinin uş boyuttaki yapısını bildiğimizzaman, onun hücre işindeki fonksiyonu hakkında da bilgi sahibi oluruz. Bir proteininbilmektedir. Bu nedenleyapısı bilinmeyen binlerce protein dizisinin yapısını belirleyebilmek işin daha etkilihesaba dayalı teknikler geliştirilmelidir.Bu tez şalışmasında proteinin ikincil yapısını tahminlemek amacıyla hesabadayalı yaklaşımlar geliştirilmiştir. Proteinlerin uş boyutlu yapısı, ikincil yapı oge-lerinden (α-helezonları, β-tabakaları, β-dünüşleri, ve düngüler) oluşmaktadır. Pro-teinin ikincil yapısının uş boyutlu yapısının oluşmasında büyük etkileri bulunmak-tadır. Bu nedenle bu tez şalışması kapsamında proteinin ikincil yapısının tahmin-lenmesi amacıyla iki farklı yaklaşım şalışılmıştır.Ilk yaklaşım, proteinlerin yapısal sınıï¬arını amino asit dizisi yardımıyla belir-lemek işin geliştirilmiştir. Proteinin yapısal sınıf bilgisi onun uc boyutlu katlanmışşekli hakkında ï¬kir verebilmektedir, cunkü proteinlerin ikincil yapısının onlarınalacağı katlanma şekli uzerinde büyük etkisi bulunmaktır. Bu yaklaşım işersinde,istatiksel sınıï¬andırma tekniklerinden birisi olan Destekşi Vectür Makinası ve ceşitliamino asit nitelik bilgileri birleştirilmiştir. Destekşi vectür makinasının yükseksınıï¬andırma yeteğine sahip olması ve amino asitler arasındaki komşuluk bilgisininkullanılması performans sonuşlarında iyileşmeye sebep olmuştur.Tez projesi işersinde yer alan ikinci calışma, proteinlerin ikincil yapı ogelerindenolan β-dünüşlerinin yine amino asit bilgisinden yararlanılarak tahminlenmesidir.Diğer ikincil yapı ogeleri kadar β-dünüşlerinin oluşmasının da proteinin katlamaaşamalarında onemi olduğu düşunülmektedir. Bu sebeple β-dünüşlerinin proteinişersindeki yerini belirleyebilmek ve tiplerini tespit edebilmek amacıyla saklı Markovmodeline ve yapay sinir ağına dayanan yaklaşımlar geliştirilmiştir. β-dünüşleri vediğer ikincil yapı ogeleri arasındaki komşuluk bilgisinin verilebilmesi uygun saklıMarkov model topolojilerinin oluşturulmasıyla sağ- lanmıştır. Proteinler arasındakievrimden kaynaklan ortak bilgiler de bir ceşit amino asit benzerlik matrisi ile sis-teme verilmektedir. β-dünüşlerinin yerlerini tahminleme probleminde saklı Markovmodellerinin ve amino asit benzerlik matrisinin kullanılması yeni bir yaklaşımdır.Bu şalışmada β-dünüşlerinin yerinin ve tiplerinin belirlenmesinde elde edilen ilksonuşlar oldukşa umit verici olmuştur. One of the most promising problems in bioinformatics is still the protein foldingproblem which tries to predict the native 3D fold (shape) of a protein from its aminoacid sequence. The native fold information of proteins provide to understand theirfunctions in the cell. In order to determine the 3D structure of the huge amount ofprotein sequence, the development of eï¬cient computational techniques is needed.The thesis studies the computational approaches to provide new solutions forthe secondary structure prediction of proteins. The 3D structure of a protein iscomposed of the secondary structure elements: α-helices, β-sheets, β-turns, andloops. The secondary structures of proteins have a high impact on the formation oftheir 3D structures. Two subproblems within secondary structure prediction havebeen studied in this thesis.The ï¬rst study is for identifying the structural classes (all-α, all-β, α/β, α+β)of proteins from their primary sequences. The structural class information couldprovide a rough description of a protein?s 3D structure due to the high eï¬ects of thesecondary structures on the formation of 3D structure. This approach assemblesthe statistical classiï¬cation technique, Support Vector Machines (SVM), and thevariations of amino acid composition information. The performance results demon-strate that the utilization of neighborhood information between amino acids andthe high classiï¬cation ability of the SVM provides a signiï¬cant improvement for thestructural classiï¬cation of proteins.The second study in thesis is for predicting one of the secondary structureelement, β-turns, through primary sequence. The formation of β-turns has beenthought to have critical roles as much as other secondary structures in the proteinfolding pathway. Hence, Hidden Markov Models (HMM) and Artiï¬cial Neural Net-works (ANN) have been developed to predict the location and type of β-turns fromits amino acid sequence. The neighborhood information between β-turns and othersecondary structures has been introduced by designing the suitable HMM topolo-gies. One of the amino acid similarity matrices is used to give the evolutionaryinformation between proteins. Although applying HMMs and usage of amino acidsimilarity matrix is a new approach to predict β-turns through its protein sequence,the initial results for the prediction of β-turns and type classiï¬cation are promising.
Collections