Computational prediction of protein subcellular localization and function
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
ÖZET Bu çalışmada, proteinlerin hem fonksiyonlarının doğrudan bulunması, hem de fonksiyonlarının bulunmasında dolaylı olarak işe yarayan hücre içindeki yerlilerinin saptanmasının mümkün olduğu iki işlemsel yaklaşım sunulmaktadır. Proteinlerin hücre içindeki yerlerinin, içerdikleri amino asit oranları kullanılmak suretiyle, yapay zeka teknikleriyle saptanmaya çalışıldı. Bitkisel ve diğer proteinlerin hücre içindeki yerlerinin ve özellikle de ökaryotların fonsiyonlarının tespiti için Destek Vektörü Makineleri adı verilen yapay zeka uygulamasına dayanan uzman sistemler tasarlandı. Bu sistemler kullanılarak, bitki ve diğer protein sınıfları için dörder hücre içi protein konumu, sırasıyla %95.4 ve %99.7 oranlarında doğru bir şekilde tahmin edilmiştir. Her iki grup için tahmin edilen mitokondri, hücredışı / sinyal ve nükleer sınıflarının yanı sıra, bitkiler için kloroplast, hayvanlar için ise sitozolik hücre konumları da sınıflandırmaya dahil edildiler. Hücre içindeki organellerle ilgili faaliyet gösteren proteinlerin fonksiyonları, konum bulmada kullanılan yöntem kullanılarak tahmin edilmeye çalışıldı. 2321 protein dizisinin %92.3'ü, seçilmiş 10 fonksiyonel kategori içine doğru bir şekilde sınıflandı. Son olarak, MEDLINE makalelerinin veri madenciliği ile analizinin fonksiyon tahminine katkı yapabileceği ayrı bir protein veri tabanı kullanılarak gösterildi. vııı ABSTRACT In this study, we present a computational approach in which it is possible to directly predict the protein functional categories from sequence and to identify the protein subcellular localization, which, in turn, is helpful for functional classification. ^` Subcellular protein locations and functions have been predicted basically from amino acid composition by using a machine learning approach. Expert systems based on Support Vector Machines have been designed to predict subcellular locations for proteins both in plants and nonplants, and function particularly for nonplants. Four subcellular localization categories for plant and nonplant proteins have been identified by correct prediction accuracies of 95.4%, and 99.7% respectively. In addition to the three common categories mitochondrial, extracellular / secretory, and nuclear; the classes cytosolic for nonplants, and, chloroplast for plants are included. Functional categories related to the subcellular compartments are predicted by using a similar approach applied for localization prediction. 92.9% of the 2321 protein sequences have been correctly assigned into the selected 10 functional categories. Finally, the contribution of the data-mining of the MEDLINE papers to the function prediction is tested by another protein data set. Vll
Collections