Metaloproteinlerin biyoenformatik analizi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Protein içerisinde bulunan metal iyonları proteinlerin fonksiyonel görevlerini yerine getirebilmesi, yapısı ve kararlılığı için önem arz etmektedir. Bu sebeple, proteinler üzerinde metal ile bağlanma noktalarının yüksek performans ile tespiti çok önemlidir. Bu çalışma ile Sistein ve Histidin aminoasitlerinin protein dizilimlerini üzerinden metal ile bağlanma durumunu tahminleyen bir çalışma sunulmaktadır. Dört ayrı yöntem belirtilen amaç doğrultusunda kullanılmıştır. Bunlar; Destek Vektör Makinaları, Naive Bayes, Değişken uzunluklu Markov Zincirleri ve Smith Waterman algoritmasının bir sınıflandırıcı gibi kullanılmasıdır. Yukarda belirtilen bütün metotlar bu sınıflandırmayı sadece protein dizilim bilgisi üzerinden gerçekleştirilmiştir. Farklı birçok öznitelik vektörü oluşturulmuş ve bunların sonuçlara olan etkisi gözlemlenmiştir. Bu çalışma ile metal bağlanma noktaları %35 duyarlılık ve %75 anma değerleriyle Naive Bayes kullanarak, %25 duyarlılık ve %23 anma değerleriyle Destek Vektör Makinaları kullanarak, %0.05 duyarlılık ve %60 anma değerleriyle Değişken uzunluklu Markov zincirleri kullanarak ve çok düşük seçicilik performansı ile Smith Waterman algoritması kullanarak tahminlenebilmiştir. Bu çalışmalar sonrasında, seçilen öznitelik vektörlerinin sonuçlara önemli etkiler yaptığı gözlemlenmiştir. Aynı zamanda elde edilen sonuçlar Naive Bayes yönteminin bu alanda rekabetçi sonuçlar ürettiğini göstermiştir. Metal ions in protein are critical to the function, structure and stability of protein. For this reason, accurate prediction of metal binding sites in protein is very important. Here, we present our study which is performed for predicting metal binding sites for histidines (HIS) and cysteines from protein sequence. Four different methods are applied for this task: Support Vector Machine (SVM), Naive Bayes, Variable-length Markov chain and Smith Waterman Algorithm. All these methods use only sequence information to classify a residue as metal binding or not. Several feature sets are employed to evaluate impact on prediction results. We predict metal binding sites for mentioned amino acids at 35% precision and 75% recall with Naive Bayes, at 25% precision and 23% recall with Support Vector Machine and at 0.05% precision and 60% recall with Variable-length Markov chain, at very low performance with Smith Waterman Algorithm. We observe significant differences in performance depending on the selected feature set. The results show that Naive Bayes is competitive for metal binding site detection.
Collections