İnsani gelişmişlik endeksinin veri madenciliği tekniklerinden olan C5.0 ve GINI algoritmaları kullanarak modellenmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İnsani Gelişme Endeksi (İGE), ülkelerin gelişmişliklerini gözönünde bulundurarak insanların mutluluğunu, sağlıklı bir yaşam ile birlikte başarılı bir hayat sürmelerini dikkate alan bir kalkınma endeksidir. Ülkelerin milli gelirlerini karşılaştırarak o ülkenin daha gelişmiş olduğunu açıklamak yeterli değildir. Birleşmiş Milletler Kalkınma Programı (UNDP) tarafından yayımlanan İGE, insan hayatının daha kaliteli bir hayat sürmesi açısından ülkelerin milli geliri, eğitim ve sağlık göstergelerine dayanarak hesaplanmaktadır. Dolayısıyla İGE, insan hayatının zenginliği açısından ülkeler arası karşılaştırma yapmak için başvurulan bir gösterge değer olmuştur. Bu çalışmada UNDP'nin 2010-2017 yıllarını kapsayan 79 ülkenin verileri kullanılarak veri madenciliğinin karar ağacı tekniklerinden C5.0 ve Gini algoritmaları ile karar ağaçları oluşturulmuştur. Karar ağaçları ile birlikte İGE'ye etki eden faktörler belirlenmiş ve ülkeler çok yüksek, yüksek, orta ve düşük düzeyde gelişmiş ülkeler olarak sınıflandırılarak kurallar elde edilmiştir. Yapılan analizler sonucunda C5.0 algoritması ile %97,94 ve Gini algoritması ile %91,93'lük doğru sınıflandırma başarısı elde edilmiştir. Bunun dışında duyarlılık ve belirleyicilik istatistikleri de hesaplanmıştır. İGE'ye en fazla etki eden değişkenlerin eğitim, istihdam ve sağlık göstergelerindeki değişkenler olduğu tespit edilmiştir. Human Development Index (HDI) is an indicator that ranks nations by their development in health, welfare and success of their citizens. Using national income alone is not sufficient to determine the level of development of a nation. HDI, published by United Nations Development Plan (UNDP), is calculated based on nation's income, education and health indicators. Hence, HDI became a metric to rank the quality of human life between countries. This study contains decision trees that are generated using C5.0 and GINI Algorithms based on UNDP data for 79 countries dating from 2010 till 2017 In addition to the decision trees, the factors that affect HDI also were determined and rules were produced by grouping countries as highly developed, developed, developing and under developed countries. Based the analyses, C5.0 and GINI algorithms produced 97.94% and 91.93% ranking accuracy respectively. Additionally, sensitivity and determinability statistics were also calculated, and the variables in education, employment and health were determined to be the most significant.
Collections