Dizilim verisinden mikrorna fonksiyon tahmini
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Gelişen teknolojiyle birlikte bilimsel çalışmalar da hız kazanmıştır. Bu durum bilimsel çalışmaların sayısını arttırıp, elde edilen sonuçların başka çalışmalarda kullanılma oranını yükseltmiştir. Dolayısıyla kusursuz verilerle ve zaman kaybını minimize ederek çalışmak önemli bir hal almıştır. Özellikle kanser gibi bütün insanlığı önemli ölçüde etkileyen hastalıklarla ilgili çalışmalarda bu durum daha da önem kazanmıştır. Kanser çalışmalarındaki ilerlemeler, mikroRNA adı verilen kısa RNA dizilerinin kanserle ilişkili olduğunu ispatlamıştır. Bu durum mikroRNA'lar üzerinde yapılan deneylerin artmasına ve ilgili veri tabanlarına bir çok veri eklenmesine sebep olmuştur. Bu veriler her ne kadar özenle elde ediliyor olsa da, bazen eksik ya da yanlış olarak kaydedilebilmektedir. Ayrıca yapılan ölçümler mikroRNA'ların keşif hızına yetişememekte ve araştırmacılar bu ölçümlerin yapılmasını beklemek zorunda kalmaktadır. Bu çalışma ile mikroRNA ların gen ifadelerinin, bilgisayar destekli yöntemlerle tahmin edilmesi amaçlanmıştır. Bu kapsamda gen ifadesi aranan mikroRNA'nın, ifadesi bilinen mikroRNA'ların promotör kısımları ve transkripsiyon faktörler arasındaki ilişkiden faydalanarak ifadesinin tahminine çalışılmıştır. Çalışmada lineer regresyon, KNN regresyon ve RVM regresyon yöntemleri uygulanmış ve sonuçların doğruluğu Spearman ve Pearson doğrulama yöntemleriyle değerlendirilmiştir. Değerlendirmeler sonucunda RVM regresyon yönteminin yüksek başarı sağladığı görülmüştür. Bu çalışma dizilim verisinden mikroRNA ifadesi tahminine yönelik ilk çalışma olduğundan, sonraki çalışmalara ışık tutması bakımından önemli bir yere sahiptir. The improvements in technology has drastically accelerated the scientific activities in all domains. The increase in the number of studies has allowed researchers to reuse existing data obtained from previous experiments. In this context, working with complete and perfect data has become an urgent need. Therefore, working with the perfect data has become an important condition. In last years, scientists have proven that, cancer is related with the activities of microRNAs. Therefore, the experiments with microRNA have increased dramatically. A huge amount of data has been inserted to related databases such as Gene Expression Omnibus. Scientist measured gene expression of microRNA using microarray technology however, some of the data measured incorrectly or it could not be measured. Most of studies had to wait for gene expression evaluation of recently discovered miRNA's. In this study, we try to predict missing data of the given promoter sequence of a micro RNA. We attempt to predict its expression using regression models ( linear regression, KNN regression and RVM regresssion ) learned from the expression levels of other microRNAs obtained through a microarray experiment. To our knowledge, this is the first study that evaluates the predictability of microRNA expression from sequence. RVM regression which uses Gaussian kernel gave us the most successful results. The results encourage the use of the system for microarray missing data imputation or completing old experiments with new explorations.
Collections