Nonparametric statistical matching methods: An application on household surveys in turkey
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İdari kayıtların ve örneklem araştırmalarının tahmin sürecinde birlikte kullanılması, istatistiki bilgilerin doğruluğunu arttırmakla beraber cevaplayıcı yükünü, zamanı, maliyeti ve işgücünü azaltmada önemli bir etkiye sahiptir. Ancak, bu yöntem farklı veri kaynaklarının birleştirilmesini gerektirmektedir.Kayıt bağlama ve istatistiksel eşleştirme, veri birleştirme için geliştirilmiş iki tekniktir. Kayıt bağlama, veride birebir eşleştirme sağlayan eşsiz bir değişken olduğu zaman kullanılan yöntemdir. Veri setinde böyle bir değişken yoksa fakat bazı ortak değişkenler varsa ve araştırmaların hedef kitleleri aynı ise, istatistiksel eşleştirme yöntemi kullanılmaktadır. Araştırmalar arasındaki ortak değişkenler eşleştirme değişkenleri olarak kullanılmakta ve birleşik veri setleri parametrik, parametrik olmayan ve karma gibi farklı eşleştirme yaklaşımları kullanılarak elde edilmektedir.Tezde, hanehalkı bazlı örneklem araştırmalarında farklı parametrik olmayan istatistiksel eşleştirme yöntemlerinin kullanılması ve değişkenlerin dağılımlarının benzerliği kullanılarak sonuçların karşılaştırılması amaçlanmıştır. Uygulamada,2014-2015 Türkiye Zaman Kullanımı Araştırması ve 2014 Türkiye Yaşam Memnuniyeti Araştırması kullanılmıştır. En yakın komşu, rastgele ve sıralı hot deck yöntemleri olmak üzere üç tane parametrik olmayan istatistiksel eşleştirme yöntemi, kısıtlı ve kısıtlı olmayan seçenekleri ile kullanılmıştır.Kullanılan tüm yöntemlerde, birleştirilmiş veri setleri eşleştirme değişkenlerin 4 farklı kombinasyonu ve dört hedef değişken kullanılarak elde edilmiştir.Her yöntem için farklı uygulamalar yapıldığından hem yöntemlerin kendi içinde, hem de yöntemler arasında karşılaştırmalar yapılmıştır.Sonuçların hem eşleştirme değişkenlerine hem de hedef değişkenlere göre değiştiği tespit edilmiştir. Ayrıca, beklentilerin aksine, kısıtlı seçeneği kullanılarak gerçekleştirilen eşleştirmenin daha iyi bir sonuç vermediği gözlemlenmiştir.Anahtar Kelimeler: İstatistiksel eşleştirme, parametric olmayan hot deck, kısıtlı ve kısıtlı olmayan hot deck The use of administrative registers and sample surveys together in estimation process has a significant effect on increasing the accuracy of statistical information and reducing the response burden, time, cost and labour. However, this requires integration of data sources.Record linkage and statistical matching are two techniques improved for data integration. Record linkage is a method used when there is a perfect agreement between indicators. If there is no such variable in the data set but there are some common variables and samples of the surveys refer to same target population then statistical matching is used. Common variables between surveys are used as matching variables and fused data sets are obtained using different matching approaches such as parametric, non-parametric and mixed.Aim of this dissertation was to apply different non-parametric statistical matching methods on household based sample surveys and compare their results regarding similarity of variables' distributions. 2014-2015 Time Use Survey of Turkey and 2014 Life Satisfaction Survey of Turkey were used in the implementation. Three non-parametric hot deck methods named as nearest neighbour distance, random and rank hot deck were used in the matching with their constrained and unconstrained versions.For each method, fused data sets were obtained using four different combinations of matching variables and four target variables. Comparisons were made both between methods, and within methods; through changes in applications for each specific method. It was found that results vary according to bothmatching variables and target variables.Moreover, contrary to expectations, constrained hot deck did not provide better result.Key words: Statistical matching, non-parametric hot deck, constrained and unconstrained hot deck
Collections