Alerjen proteinlerin otomatik sınıflandırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Alerjen proteinlerin tanınması ve sınıflandırılması, özellikle son yıllarda sıkça kullanılan genetik değişikliğe uğramış gıdaların denetlenmesi ve biyo-ilaçların tasarımı açısından büyük önem kazanmıştır. Dünya Sağlık Örgütü ve Gıda ve Tarım Örgütü kurumları bu amaçla alerjen proteinlerin tespiti için bazı rehberler hazırlamıştır. Ancak, bu rehberlerde önerilen yöntemler çoğunlukla yarı-otomatik gerçekleştirilen ve tahmin yeterliliği düşük olan yöntemlerdir. Son birkaç yılda bazı otomatik yöntemler önerilse de bunlar ya istenilen yeterlilik seviyesine ulaşamamış ya da işlem zamanı ve bellek gereksinimi açısından avantajsız olmuşlardır. Bu çalışmada, alerjen proteinlerin sadece dizilim verisi kullanılarak, farklı makine öğrenme yöntemleri bilinen bazı dizilim gösterim yaklaşımları ile denenmiştir. Farklı dizilim gösterim yöntemleri için K-En Yakın Komşu, Bulanık K-En Yakın Komşu ve Destek Vektör Makineleri (DVM) kullanılmış ve sonuçlar karşılaştırmalı olarak verilmiştir. The prediction and classification of the allergen proteins have received great importance on the inspection of genetically modified food, which are used especially in the recent years, and the design of bio-pharmaceuticals. World Health Organization (WHO) and Food and Agriculture Organization (FAO) prepared guidelines for the prediction of allergen proteins. However, the methods proposed in these guidelines are mostly semi-automatic and have low prediction accuracy. Although some automated methods have been proposed in the last few years, either they could not reach the required sufficiency level or they were insufficient as for the processing time and memory usage. In this study, various machine learning methods were tried with some known sequence representation approaches by using only the sequence data of the allergen proteins. For various sequence representation approaches, K-Nearest Neighbour, Fuzzy K-Nearest Neighbour and Support Vector Machines (SVM) were used and the results were given with comparison.
Collections