Sampling error estimation by using different methods and software in complex samples
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tezin amacı Türkiye Nüfus ve Sağlık Araştırması, 2008 (TNSA-2008) verisinden seçilen değişkenler için örnekleme hatalarını farklı yöntemler ve yazılımlar kullanarak tahmin etmektir. TNSA?2008 örneklemi ağırlıklı, çok aşamalı, tabakalı küme örneklemesi yaklaşımı kullanılarak seçilmiştir. Basit rasgele örnekleme yöntemi dışında bir örnekleme yöntemi kullanılarak seçilen örneklem tasarımları karmaşık örneklem tasarımı olarak adlandırılır ve özel işlem gerektirir. Bu nedenle, TNSA-2008 verisinin örnekleme hataları, bu veriden hesaplanacak diğer istatistikler gibi örneklem tasarımını dikkate alarak hesaplanmalıdır. TNSA?2008 verisinden seçilen değişkenlerin varyanslarını tahmin etmek için Taylor lineerizasyon metodu, dengelenmiş tekrarlı yöntem ve jackknife tekrarlı yöntem kullanılmıştır.Sadece bazı istatistik yazılımları karmaşık tasarımlı alan örneklemesi araştırmaları analizi yapabilirler. TNSA?2008 veri setinden seçilen değişkenlerin örnekleme hataları ISSA programının ?Örneklem hataları hesaplama modülü? (SAMPERR) kullanılarak hesaplanmıştır. Buna ek olarak, bu tezde örnekleme hatalarını hesaplamak için beş tane istatistik yazılımı seçilmiştir. Bu yazılımlar, PASW Statistics 18 (daha önceki adı SPSS), Stata 11, WesVar 5.1, SAS/STAT ve IVEware'dir. Farklı yöntemler ve yazılımlar kullanılarak örnekleme hataları toplam onbir yaklaşım ile hesaplanmıştır. Orantı, standart hata, desen etkisi, göreceli hata ve güven aralıkları Türkiye, kent, kır, Batı, Güney, Orta, Kuzey ve Doğu bölgeleri olmak üzere sekiz nüfus alanı için hesaplanmıştır. Farklı programlarla ve aynı program içinde farklı yöntemlerle hesaplanan desen etkileri birbirleriyle ve ISSA-SAMPERR ile aynı sonuçları vermemektedir. Tüm yaklaşımlar dikkate alındığında jackknife n tekrarlı yöntemi TNSA-2008'den elde edilen değişkenlerin örnekleme hatalarını hesaplamak için en uygun yöntem olarak bulunmuştur. The aim of this thesis is to estimate the sampling errors of selected variables of Turkey Demographic and Health Survey-2008 (TDHS-2008) data by using different methods and software. TDHS-2008 sample was selected by using a weighted, multistage, stratified cluster sampling. Sampling designs that differentiate from simple random sampling are called complex sampling designs and require specific treatments. Therefore, sampling errors as well as other statistics from the TDHS-2008 data should be computed by taking its sample design into account. Taylor series linearization, balanced repeated replication and jackknife repeated replication techniques are used to estimate variances of selected variables of TDHS-2008 in the thesis.Not all statistical software are capable of dealing with complex sample survey data. The variances of selected variables given in TDHS-2008 main report are estimated by using ISSA Sampling Error Module (SAMPERR). Additionally, five statistical software were selected to compute sampling error estimates of selected variables in the thesis. These software are; PASW Statistics 18 (formerly known as SPSS), Stata 11, WesVar 5.1, SAS/STAT and IVEware. By using the available variance estimation methods in these software, sampling errors of variables are calculated with eleven different approaches. The estimations of proportion, standard error, design effect, coefficient of variation, lower and upper bounds are tabulated for eight domains; Turkey, urban, rural, West, South, Central, North and East regions. The design effect values computed with different software and methods within software are differ from each other and from ISSA-SAMPERR. Considering all approaches, jackknife n repeated replication technique is found the most eligible technique for sampling error estimations of TDHS-2008 variables.
Collections