Farklı kümeleme analizi yöntemleri ile Türkiye`deki illerin sosyo-ekonomik özelliklerine göre sınıflandırılması ve karşılaştırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmada; Türkiye'deki 3 farklı yıla 55 değişken ait 81 ilin sosyo-ekonomik verilerin klasik kümeleme analizi yöntemlerinden hiyerarşik kümeleme analizi olan 7 farklı (Gruplar Arası, Grup İçi, En Yakın Komşuluk, En Uzak Komşuluk, Centroid Metodu, Medyan, Ward's Yöntemi) teknik ile analiz yapılarak karşılaştırmalı olarak incelenmiştir. Verilere yapılan analizlerin uygunluğu klasik kümeleme analizi geçerlilik indekslerinden olan Silhoutte küme geçerlilik indeksi ile araştırılmıştır ve her veri seti için uygun küme sayısının 5 olmasına karar verilmiştir. Türkiye istatistik kurumunun internet sitesi üzerinden alınan veriler 2002, 2008 ve 2013 yıllarına ait sosyo-ekonomik dinamikleri kuvvetli veriler kullanılmıştır. Sosyo-ekonomik veriler için farklı yıllara ait değişkenlerin ölçüm düzeyleri farklılık göstermesinden dolayı çalışmanın uygulama kısmında değişkenler için standartlaştırılma yapılmıştır. Bu yıllara ait yapılan küme geçerlilik indeksi sonuçlarında da 2002 yılı için grup içi ve medyan kümeleme arasında yüksek ilişki gözlemlenmiştir. 2008 yılı geçerlilik indeksi sonuçlarında ise Yakın Komşuluk Kümeleme ile Medyan Kümeleme sonuçları aynı çıktığı görülmektedir. Yüksek ilişkili kümeleme yöntemleri olsa da, sonuçlar 2002 yılına ait sonuçlar kadar yüksek olmadığı incelenmiştir. 2013 yılında ise Gruplar Arası Kümeleme ile Medyan Kümelemenin aynı sonuçlar verdiği, En Uzak Kümeleme ile Ward Kümelemenin yüksek korelasyon katsayısına sahip olduğu görülmektedir. Klasik kümeleme analizi yöntemlerinden ward's yöntemi 2002, 2008 ve 2013 yılları için genel olarak gerçek sosyo-ekonomik yapılarla bağdaşan sonuçlar çıkarmıştır.Anahtar Kelimeler: Kümeleme Analizi, Hiyerarşik kümeleme analizi, Sosyo - Ekonomik, Küme geçerlilik, Silhoutte, Korelasyon In this study; 3 belonging to different years in Turkey 55 variations of the 81 provinces of the socio-economic data of classic cluster analysis method of hierarchical clustering analysis with 7 different (between, within groups, Nearest Neighborhood, furhest neighbor, centroid method, median, Ward's Method) techniques In this study, it was analyzed by comparative analysis. The suitability of the analyzes to the data was investigated with the Silhoutte cluster validity index, which is one of the classical clustering analysis validity indices, and it was decided that the appropriate number of sets for each data set would be 5. Data received via the website of Turkey's statistical agency in 2002, 2008 and 2013, the dynamics of socio-economic data were used strong. As the measurement levels of variables for different years differ for socio-economic data, standardization was applied for variables in the application part of the study. The cluster validity results of these years showed a high correlation between intra-group and median clustering. In the results of 2008 validity index, it is seen that Close Cluster Clustering and Median Clustering results are the same. Although there are high within groups clustering methods, the results are not as high as the results for 2002. In 2013, it was observed that between groups and Median Clustering gave the same results, and Ward Clustering with the furhest neighbor Clustering had a high correlation coefficient. The wardtırs method, which is one of the classical clustering analysis methods, has shown concordant with the actual socio-economic structures for the years 2002, 2008 and 2013.Key Words: Cluster Analysis, Hierarchical clustering analysis, Socio - Economic, Cluster validity, Silhoutte, Correlation
Collections