Cinsiyet eşitsizliğini etkileyen faktörlerin C5.0, CART, CHAID analizi yöntemiyle sınıflandırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmada Küresel Cinsiyet Eşitsizliği Raporundan elde edilen verilerle, toplumsal cinsiyet temelli eşitsizliklerin büyüklüğünün rakamlarla ve zamana bağlı olarak değişiminin incelenmesi amaçlanmıştır. Bu amaçla ülkelerin profilini oluşturan dört temel fonksiyon (sağlık, eğitim, ekonomi ve siyaset) ele alınmıştır. Çalışmada veri madenciliği sınıflandırma yöntemlerinden faydalanılmıştır. 144 ülke için 2006-2016 dönemini kapsayan bir panel veri seti oluşturulmuş ve bu veriler Dünya Ekonomi Formundaki raporlardan temin edilmiştir. CART, C5.0 ve CHAID algoritmaları ile yapılan analiz sonucunda karar ağaçları oluşturulmuş ve ülkelerin cinsiyet eşitsizlik oranını ortaya çıkaracak oranın hangi değişkenin etkisi ile gelişmiş ya da gelişmemiş kategori de olduğu belirlenmek istenmiştir.C5.0, CART, CHAID algoritmaları kullanılarak yapılan analiz sonuçlarına göre en önemli değişkenlerin X5 (profesyonel ve teknik işçiler) değişkeni ve X4 (kanun yapıcılar, yetkililer ve yöneticiler) değişkeni olduğu ve bu iki değişkenin kök düğümün ilk bölünme noktasını oluşturdukları ve X13 (yönetici pozisyonundaki kadınlar) değişkenin de karar ağacının ikinci düğümden devam ederek diğer bölünmeyi oluşturduğu tespit edilmiştir.Anahtar kelimeler: Cinsiyet eşitsizliği, veri madenciliği, sınıflandırma. In this study data obtained from Global Gender Inequality Report, it is aimed to examine magnitude of gender based inequalities with the numbers and depending on the change of time. For this purpose, the four main functions (health, education, economy and politics) that make up the profile of the country are used. Data mining classification methods were used in the study. A panel data set was created for 144 countries covering the period 2006-2016 and these data are obtained from reports in the World Economic Form. Decision tree made by analysis of CART, C5.0 and CHAID algorithms and that the ratio that would reveal the countries' gender inequality ratio was developed or not developed by the effect of the variable.According to the results of analysis using C5.0, CART, CHAID algorithms the most important variables are X5 (Professional and technical workers) variable and X4 (lawmakers, authorities and executives) variable and these two variables form the first division point of the root node and X13 (women in administrative position) variable was determined to be the second division of the decision tree to form the other division.Keywords: Gender inequality, data mining, classification.
Collections