A high-performance algorithm for automated prediction of protein-protein interactions
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
ÖZETÇE Hesaplamalı Biyolojinin ve Biyobilişimin en büyük hedeflerinden biri biyolojik sistemlerin ve süreçlerinin daha iyi anlaşılabilmesini sağlamaktır. Tüm proteinlerin oluşturduğu etkileşim ağının aydınlığa kavuşturulması bu hedefe yönelik çalışmaların önemli bir parçasıdır. Dolayısıyla, protein-protein etkileşimlerini hızlı ve güvenilir bir şekilde kestirebilecek bilgisayar programlarına duyulan gereksinim gün geçtikçe artmaktadır. Bu tezde protein- protein etkileşimlerini yüksek başarılı bir şekilde kestirebilmek için tasarlanan bir algoritma sunulmaktadır. Bu algoritmanın tasarımında protein arayüzeylerindeki yapısal ve dizilimsel korunma görüngüsünü birleştiren yeni bir `aşağıdan yukarıya yaklaşım` kullanılmıştır. Algoritmayı 67 elemanlı bir şablon arayüzey ve 6170 elemanlı bir hedef pro tein veritabanı üzerinde çalıştırarak 62616 farklı protein-protein etkileşimi kestirilmiştir. Bu kestirimlerin daha sonra 3 farklı etkileşim veritabanıda harşılıklarının bulunup bulunmadığı denetlenmiştir. Ayrıca, bazı ilginç kestirimler yazında da taranmıştır. Sonuçlarda doğrulanan ile doğrulanmayan kestirimler arasında iyi bir denge olduğu görülmüştür. Doğrulanan kestirimler algoritmamızın güvenilirliğini gösterirken doğrulanmayan kestirimler doğada bulunan ama henüz gözlenmemiş olan veya laboratuar ortamlarında gerçekleştirilebilecek etkileşimlere işaret ediyor olabilirler. Bu doğrulanmamış etkileşim kestirimlerinin ilaç tasarımı alanında önemli etkilerinin olabileceğini düşünmekteyiz. Kestirim ve doğrulama sürelerini haftalar mertebesinden günler mertebesine indirebilmek için algoritmaları paralelleştirilmiş, kestirim algoritmasının 32lik bir Beowulf bilgisayar yığınında 29.39 kat hızlandığı gözlemlenmiştir. ABSTRACT The major goal of Computational Biology and Bioinformatics is to achieve a better un derstanding of the principles of biological systems and processes using informatics tools. Elucidation of the full network of protein-protein interactions is a crucial part of this chal lenge. Thus, there is a growing need for fast and reliable in silico methods for predicting protein-protein interactions. Here, we present a high-performance algorithm for automated prediction of protein-protein interactions. We adopt a novel bottom-up approach that com bines structure and sequence conservation in protein interfaces. Starting with 67 known structures of protein interfaces and 6170 protein structures, we predicted 62616 distinct in teractions. We then checked whether these interactions existed in three different interaction databases. We also searched literature for some interesting cases. The results displayed a good balance of verified and unverified predictions. Verified interactions prove the relia bility of our algorithm whereas unverified ones may correspond to unobserved interactions that actually occur in nature or may synthetically be realized in laboratory conditions. We believe these unverified predictions may have important implications regarding drug design. We parallelized the algorithms to reduce execution times from the order of months to days: parallelized prediction algorithm demonstrated a speed up of 29.39 on a 32 node Beowulf cluster. IV
Collections