Show simple item record

dc.contributor.advisorÖzdamar, Kazım
dc.contributor.authorBal, Cengiz
dc.date.accessioned2020-12-29T11:25:22Z
dc.date.available2020-12-29T11:25:22Z
dc.date.submitted2003
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/400879
dc.description.abstractÖZET Eksik veri problemi, yıllardır araştırmacıların bilimsel bilgiyi üretmelerinde önlerindeki en büyük engellerden biri olmuştur. Özellikle sağlık alanında toplanan verilerde eksik gözlem değerleri, analiz aşamasında ve sonuçların genellenmesi aşamasında karar verirken, araştırmacıya zor anlar yaşatmakta ve hatalı kararlar vermesine neden olabilmektedir. Eksik veriler, gerek saha araştırmalarında gerekse laboratuar koşullarında yapılan çalışmalarda araştırmacının karşısına çıkabilmektedir. Araştırmacılar öncelikle eksik veriyi ortaya çıkartan nedenleri ve eksik verinin araştırma içerisindeki önem derecesini belirlemelidirler. Bu araştırma bir benzetim çalışmasıdır ve farklı birim sayılarına sahip türetilmiş veri setleri yardımıyla, eksik veri atama yöntemleri karşılaştınlmıştır. Türetilen veri setleri, sırasıyla; 50, 100, 200, 300, 400 ve 500 birim içerecek şekilde, çok değişkenli standartlaştınlmış normal dağılım varsayımından yararlanılarak ve düşük ve yüksek korelasyonlu değişkenleri içerecek şekilde türetilmiştir. Rasgele koşullar altında %5, %10, %15 ve %20 eksiltilen veri setleri TROK (MCAR) yapıya sahiptir. Elde edilen veri setlerinin analizleri sonucunda Listwise, Pairwise, Ortalama, Regresyon ve EM atama yöntemleri düşük hacimli örneklerde tutarsız sonuçlar vermişlerdir (n<200). Fakat tam veri setine en yakın sonuçlar, EM atama yönteminden elde edilmiştir. Benzer şekilde, yüksek hacimli örneklerden elde edilen sonuçlarda da, EM atama yöntemi tam veri setlerine oldukça yakın sonuçlar vermiştir. EM atama yöntemi özelikle 200 birim ve üzerindeki veri setlerinde, %5-%20 arasındaki eksik veri yapılarında diğer atama yöntemlerine göre daha iyi sonuçlar vermiştir. Türetilmiş veri setlerinden elde edilen sonuçlara göre, bazı değişkenlerinde yaklaşık %20 gözlem değeri eksik olan sağlık alanındaki gerçek bir veri seti EM atama yöntemi ile tamamlanmış ve analizler eksik veri seti ile karşılaştırmalı olarak sunulmuştur. Anahtar Kelimeler: Atama yöntemleri, EM, Regresyon atama, Listwise, Pairwise, Ortalama atama. V
dc.description.abstractSUMMARY The problem of missing values has been a big difficulty to produce scientific information. Especially missing observations create difficulties for the analysis and for the generalization of the results in health sciences and could make one give wrong decisions. Missing values can come up in either survey research or in laboratory conditions. Researchers, first of all, should investigate the reasons for missing value and the importance of missing values in data set. In this thesis, simulation study is done, using simulated data sets having different sample sizes, and also some imputation methods are compared. Simulated data is taken from multivariate Normal distribution in which either high correlation matrix or low correlaton matrix is assumed, and the sample sizes are set to 50, 100, 200, 300, 400, and 500. 5%, 10%, 15%, and 20% of simulated samples are randomly set missing, and MCAR (TROK) property is observed on the reduced samples. It is seen that Listwise, Pairwise, Mean, Regression, and EM imputation methods have consistency problems for small sample sizes (n<200). However, the closest results to the results of full data set are produced by EM method. Similarly, for large sample sizes, EM produced the closest results to the full data set. Also, EM imputation produced better results for large samples (n>200) with missing value percentages between 5-20. Based on the information gained by the simulation study, a case data set on which some variables having 20% missing value is completed using EM imputation method, and the results are given in detail. Key Words : Imputation Methods, EM, Regression, Listwise, Pairwise, Mean Imputation. VIen_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectTıbbi Biyolojitr_TR
dc.subjectMedical Biologyen_US
dc.titleÇok gruplu veri setlerinde eksik gözlem sorununun çözümlenmesi ve sağlık alanında bir uygulama
dc.title.alternativeThe solution of missing value promlem in multigrouped data sets and an application in health
dc.typedoctoralThesis
dc.date.updated2018-08-06
dc.contributor.departmentBiyoistatistik Anabilim Dalı
dc.identifier.yokid140327
dc.publisher.instituteSağlık Bilimleri Enstitüsü
dc.publisher.universityESKİŞEHİR OSMANGAZİ ÜNİVERSİTESİ
dc.identifier.thesisid137921
dc.description.pages146
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess