Mikrodizi verilerinde farklı yapı ve sayıda ortaya çıkan eksik verilerin 1.tip hata üzerine etkisinin araştırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Eş zamanlı olarak binlerce genin ekspresyon düzeylerini ölçmeye yarayan mikrodizi teknolojisi, son yıllarda önemli araçlardan biri olmuştur. Mikrodizi teknolojisinde arka plan pikselleri ve spot pikselleri arasındaki eşitsizlik, hibridizasyon sırasındaki hatalar, floresan yoğunluğu, slayt yetmezliği, slaytlarda bulunan toz ya da çizikler, görüntünün bozulması, çözünürlüğün yeterli olmaması, deneysel hatalar gibi pek çok sebep veri yapısında eksik/kayıp verilerin oluşmasına sebep olabilmektedir. Bu sebeplere göre eksik veri yapısı bazı setlerde %10 olabiliyorken bazı veri setlerinde bu oran %90'a kadar çıkabilmektedir.Bu çalışmamızda Princeton Üniversitesi Onkoloji Bölümü Mikrodizi veri tabanında bulunan araştırmacının kullanımına açık olarak yer alan, Adenoma ve Carcinoma mikrodizi setlerinde, farklı oranlarda meydana gelen eksik gözlem durumunda iki bağımsız grup ortalamalarının karşılaştırılması sonucu oluşan 1. Tip hatalar yorumlanmıştır. Çalışmada Matlab R2015a programından yararlanarak %1, %5, %10, %15, %20, %30, %40, %50, %60, %70, %80 ve %90 oranlarında rasgele eksik veri yapısı oluşturulmuştur ve her oran için 1000 tekrar gerçekleştirilmiştir. Oluşturulan eksik veri setlerinin her biri için Student t testi, Benjamini Hochberg ve Benjamini Yekutieli prosedürleri ve mikrodizi veri setleri için önerilen mikrodizi anlamlılık analizi (significance analysis of microarray) uygulanmıştır. Oluşturulan eksik veri oranlarına göre; eksiklik yüzdesi arttıkça 1. Tip hata oranlarında bozulma meydana gelmektedir. Gerçek veri setinde kullanılan dört yöntem birbiriyle karşılaştırıldığında beklenen %5 1. Tip hata oranına en yakın sonucu mikrodizi anlamlılık analizi vermiştir ve eksiklik oranlarından en az etkilenen testtir. Beklenen %5 1. Tip hata oranına ikinci olarak en yakın sonucu veren test Benjamini Yekutieli prosedürü olmuştur.Kullanılan bütün testler örneklem genişliğinden etkilenmektedir. Simultaneously, the means for measuring expression levels of thousands of genes microarray technology has been one of the major tools in recent years. There are many reasons such as inequality between background pixels and spot the pixels, error during hybridization, fluorescent intensity, slide failure, dust or scratches found on the slide, poor image, lack of adequate resolution may lead to missing or lost data for data structure in the microarray technology. For reasons like these, missing data structure in some data sets could 10%, this rate can reach up to 90%. In this study, in the Princeton University Department of Oncology Microarray database located as available to researchers, in the Adenoma and Carcinoma microarray sets, in case of missing observations seen at different rates resulting from the comparison of two independent group average Type 1 errors were interpreted. In proportion as 1%, 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80% and 90% random missing data structure is formed and conducted 1000 repeated for each rate. According to the missing value rate generated, increasing missing data rate cause to deterioration in the Type I error rate. When comparising the four methods to each other in the real data, Significance Analysis of Microarray give the nearest results to expected 5% Type I error rate and the lowest effected from missing value rates. Benjamini Yekutieli procedure is the second test that give the nearest results to expected 5% Type I error rate. All of the test used effected from sample size.
Collections