Proteinlerdeki düzensiz bölgelerin tespiti için kaotik ve fizikokimyasal özellikler tabanlı yeni öznitelik kodlama yöntemleri geliştirilmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Canlının hayatını devam ettirmesinde kritik önem taşıyan proteinler, tüm biyokimsayal reaksiyonlarda yer almaktadır. Proteinleri oluşturan aminoasitlerin fizikokimyasal özellikleri, amino asitlerin bağlanma sıralarının ve proteinin üç boyutlu yapısının oluşmasında en önemli belirleyicidir. Amino asitler peptit bağlarıyla birbirlerine bağlanır, bu durum hücre içerisinde en düşük enerji seviyesine sebep olur. Böylelikle, protein zincirleri doğal durumunda katlanır ve proteini meydana getirirler. Proteinlerin her bir düzgün katlanması konformasyon olarak adlandırılırken aynı zamanda katlanamayan diğer bir ifadeyle düzensiz proteinlerde oluşabilmektedir. Düzensiz proteinler organizma içerisinde kanser, alzheimer, kardiyovasküler, kistik fibrozis ve diyabet gibi metabolik bir çok hastalıklığa sebep olmaktadır. Bu nedenle proteinlerde düzensiz bölgelerin tespiti hastalıkların tedavisi ve ilaç geliştirilmesi açısından önemli bir eşiktir. Literatürde proteinlerde düzensiz bölgelerin tespiti için in vitro ve in silico çalışmalar yapılmaktadır. Bilgisayar ortamında gerçekleştirilen in silico çalışmalar in vitro çalışmalara göre maliyet ve zaman açısından üstünlüklere sahiptir. Buna göre bilgisayar ortamında düzensiz bölgeler çeşitli makine öğrenmesi algoritmaları ve biyoinformatik yöntemleri ile tespit edilmeye çalışılmaktadır. Bu tez çalışmasında, öncelikle protein dizilimleri fizikokimyasal özelliklere göre kodlanarak faz uzayında incelendi ve kaotik yapı içeren fizikokimyasal özellikler belirlendi. Sonrasında proteinlerdeki düzensiz bölgeleri tahmin etmek için belirlenen amino asitlerin fizikokimyasal özellikleri kullanılarak makine öğrenmesi algoritmaları için En İyi Fizikokimyasal Özelliklere Göre Öznitelik Kodlama Yöntemi (FKÖY) ve Lyapunov Üstelleri ve En İyi Fizikokimyasal Özelliklere Göre Öznitelik Kodlama Yöntemi (LÜ-FKÖY) olarak isimlendirilen iki öznitelik kodlama yöntemi geliştirilmiştir.Proteinlerde düzensiz bölgelerin tespiti için DisProt ve PDB verisetleri üzerinde geliştirilen yöntemler sınıflandırıcı algoritmalarla uygulanmıştır. Elde edilen deneysel sonuçlarda LÜ-FKÖY, literatürde yer alan yöntemlere göre en yüksek performansı sergilemiştir. Proteins located in all biochemical reactions have vital importance for continue of organism life. Physicochemical properties of amino acids that constitute proteins are the most important to formation for three-dimensional structure of protein and binding orders of amino acids linked by peptide bonds. Moreover, this condition leads to the lowest energy level in the cell. In this way, protein chains are folded naturely and created proteins. Each of ordered proteins is called the conformation. And also, disordered proteins can be formed. Disordered proteins cause many metabolic disease in organisms such as cancer, alzheimer, cardiovascular, cystic fibrosis and diabetes. Therefore, prediction of disordered regions in proteins is a significant threshold in terms of development of treatment for the diseases.In the literature, many studies have been applied to the prediction of disordered regions in protein in vitro and in silico enviroments. In silico study performances on computer has some advantages like cost and time-consume relatively in-vitro studies. Prediction of disordered regions have been determining by various machine learning algorithms and bioinformatics methods in silico. In this thesis, primarily, protein sequences coded by physicochemical properties and examined in phase space. Moreover, physicochemical properties on based chaotic structure was determined. And than, it has been developed using machine learning algorithms determined physicochemical properties of the amino acids such as Feature Encoding Method by Selected Best Physicochemical Properties and Features Encoding Method by Lyapunov Exponents and Selected Best Physicochemical Properties. Proposed methods have been applied with classifier algorithms on DisProt and PDB datasets to the prediction of disordered region in proteins. According to obtained experimental results that our methods have demonstrated the highest performance than most methods in the literature.
Collections