Hanehalkı işgücü araştırma verileri ile veri madenciliği yöntemlerinin uygulanması ve modellerin karşılaştırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günümüz koşullarında büyüyen ve genişleyen veri hacmiyle birlikte verilerin değerlendirilmesi, analiz edilmesi ve ileriye yönelik tahminlerin yapılması gibi ihtiyaçların artması veri madenciliği yöntemlerine olan yönelimi artırmıştır. Bu çalışma kapsamında veri madenciliğinin tahmin edici yöntemlerinden sınıflama ve regresyon yöntemleri ele alınmış olup C5.0 karar ağacı, CHAID karar ağacı, Lojistik Regresyon ile Bayes Ağları yöntemleri incelenmiş ve gerçek bir veri seti üzerinde uygulanarak modelleme başarıları karşılaştırılmıştır. Çalışmada TÜİK tarafından derlenen ve uygulanan Hanehalkı İşgücü Araştırması (HİA)' nın 2014, 2015 ve 2016 yıllarına ait verileri ele alınmıştır. Ayrıca bu çalışma kapsamında Türkiye'de işgücü durumunun belirlenmesi, hem istihdam kapsamında hem de istihdam dışında olan birey profiline ilişkin sınıflamaların yapılması ile işgücü durumu bilinmeyen bir bireyin model sonucunda işgücü durumunun doğru tahmin edilmesi amaçlanmıştır. Çalışma sonuçları değerlendirildiğinde, çeşitli ölçütlerle yapılan kıyaslamalarda model başarıları birbirine oldukça yakın olarak edilmiş olmasına karşın C5.0 karar ağacı yöntemi sonucunda elde edilen modelin en başarılı sınıflama tahminine sahip olduğu sonucuna ulaşılmıştır. In today' s conditions, increasing the need for such as assessing, analyzing and making forward estimates of data, has increased the demand for data mining methods. In this study, classification and regression estimating methods of data mining are discussed, C5.0 decision tree, CHAID decision tree, Logistic Regression and Bayesian Networks methods are examined and the modeling successes were compared by applying them on a real data set. Additionally, data on the Household Labor Force Survey compiled and implemented by Turkish Statistical Institute for 2014, 2015 and 2016 years. Also, within the scope of this study to determine the labor situation in Turkey, both the employed labor force status by making regarding the classification of individuals outside employment profile is intended to be an accurate estimate of the labor situation as a result of unknown individual models.When the study results were evaluated, it was calculated that the model obtained as a result of the C5.0 decision tree method had the most successful classification prediction even though the model successes were relatively close to each other in comparison with various criteria.
Collections