Show simple item record

dc.contributor.advisorKarahasan, Mehmet
dc.contributor.authorSayin, Gökhan
dc.date.accessioned2020-12-29T13:19:50Z
dc.date.available2020-12-29T13:19:50Z
dc.date.submitted2010
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/423737
dc.description.abstractYerel bazda sosyo-ekonomik gelişmişlik düzeyinin ölçülmesi veya belirlenmesi, ilgili yerel yöre için idari, mali ve sosyal açılardan daha doğru kararlar verilmesini, daha gerçekçi projeler geliştirilmesini ve kaynakların daha iyi dağıtılmasını sağlayabilir.Kümeleme işlemi sosyo-ekonomik gelişmenin belirlenmesinde kullanılabilecek bir araçtır. Aşamalı ve K-ortalamalar kümeleme algoritmaları yaygın olarak kullanılan kümeleme araçlarından ikisidir. Aşamalı kümelemede algoritmanın hangi adımda durması gerektiğine dair kesin bir ölçüt olmaması ve bir kez bir kümeye atanan nesnenin, kümelemeyi iyileştirmek adına başka bir kümeye atanamaması dezavantajlar olarak görülmektedir. Öte yandan, K-ortalamalar kümeleme algoritması önceden kümelerin sayısının belirlenmesini gerektirir, aykırı değerlere duyarlıdır ve sonuç başlangıç küme merkezlerine bağlıdır. Dolayısı ile yukarıda sözü edilen dezavantajların bazılarından kurtulmak için aşamalıdan elde edilen küme merkezlerinin K-ortalamalar algoritmasında kullanıldığı bir hibrid yaklaşımı uygulanabilmektedir.Bu çalışmada ilçelerin sosyo-ekonomik gelişmişlik seviyelerini tespit edilmesi ve bu tespit doğrultusunda gelişmişlik sıralamasının yapılması amaçlanmıştır. Ayrıca, yukarıda tanımlanan Hibrid Kümeleme Yönteminin tanıtımının, uygulamasının yapılması ve bulunan sonuçlar çerçevesinde Hibrid algoritmasının faydalarının belirtilmesi hedeflenmiştir.İlçelerle ilgili TÜİK' in veri tabanında, 2008 yılına ilişkin ekonomik ve sosyal alanlardan seçilen demografik, eğitim, medeni durum ve tarım göstergelerinden oluşan veri seti kullanılmıştır. İlgili yıl itibariyle, mevcut idari yapı temelinde 81 ile bağlı 957 ilçe (hakkında ilgilenilen değişkenler bazında çoğunlukla veri bulunmayan 12 ilçe hariç) kapsanmış ve bu ilçelere ilişkin sosyal ve ekonomik göstergeler arasından seçilen 23 adet değişken dikkate alınmıştır. Değişken sayısı verilerin ön incelemesi sonucu 20' ye indirilmiştir.Bu çalışmada verilere ilk önce değişken sayısını indirgemek amacıyla temel bileşenler analizi uygulanmıştır. Daha sonra ise yaklaşık %81' lik açıklama oranına sahip 5 temel bileşen üzerinden aşamalı, K-ortalamalar ve hibrid kümeleme algoritmaları Minitab 14 ve Spss 15 paket programları kullanılarak uygulanmıştır. Her bir algoritma için küme sayısı olarak K=4, 5, 6 ve 7 alınmıştır. Elde edilen kümeleme sonuçları amaç fonksiyonunun değeri, ortalama silhouette genişliği ve Davies-Bouldin İndeksi açısından karşılaştırılmıştır.Karşılaştırma sonuçlarına göre, K=6 ile grup içi bağlantı yöntemiyle aşamalı kümeleme ve K-ortalamalar yöntemini kullanan Hibrid algoritması sonuçlarının en iyi olduğu kararına varılmıştır. Bu sonuçlara göre Türkiye' deki coğrafi bölgelerin gelişmişlik sıralaması yapılmıştır.
dc.description.abstractMeasuring or determining level of socio-economic development on a local basis can enable better decisions to be made, more realistic projects to be developed, and resources to be allocated more efficiently for that area in terms of administrative, financial, and social aspects.The process of clustering is a tool which can be used in determining socio-economic development. Hierarchical and K-means clustering algoritms are two of widely used clustering algoritms. It is considered as disadvantages of hierarchical clustering that there is no certain criteria about in which step to stop algorithm and that once an object has been assigned to a cluster, it cannot be reassigned any other cluster in the name of improving clustering. On the other hand, K-means algorithm requires to determine the number of clusters in advance, and it is sensitive to outliers, and the results depend on initial cluster centers. Thus, in order to eliminate some of disadvantages mentioned above, a hybrid approach in which the cluster centers obtained from hierarchical algorithm are used in K-means algorithm can be applied.In this study, it is aimed first to determine socio-economic levels of the counties in Turkey, and then to make ranking of them according to the socio-economic status determined. In addition, it is objective of this study to introduce and apply the hybrid clustering method described above and indicate the benefits of the hybrid algorithm in the context of the results obtained.A data set consisting of demographic, education, civil status and agriculture indicators chosen from economic and social domain for the year of 2008 was used in the database of Turkish Statistics Institution for the counties. On the basis of the administrative structure of Turkey as of the year, 957 counties of 81 provinces in Turkey (except for the 12 counties about which data were not available) were covered and 23 variables for the counties were taken into consideration. As a result of preliminary data analysis the number of variables was reduced to 20.In the study, first principal components analysis was applied to the data in order to reduce the number of variables. By using statistical packages Minitab 14 and SPSS15, hierarchical, k-means and hybrid clustering algorithm were applied to five principal components selected. The number of clusters was taken as K=4, 5, 6 and 7 for each of the algorithms. The results of clustering were compared in terms of values of the objective function, average silhouette width and Davies-Bouldin index.According to results of the comparison, it was concluded that the results of the hybrid algorithm with K=6 which uses hierarchial algorithm with within average linkage and k-means algorithm together are best. Then, based on the results, the ranking of status of development for the geographic regions of Turkey was made.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectEkonometritr_TR
dc.subjectEconometricsen_US
dc.subjectİstatistiktr_TR
dc.subjectStatisticsen_US
dc.titleHibrid ve indirgenmiş kümeleme analizi ile Türkiye`deki ilçelerin sosyo-ekonomik özelliklerine göre sınıflandırılması
dc.title.alternativeClassifying the counties of Turkey according to their socio-economic characteristics by hybrid and reduced clustering analysis
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentİstatistik Anabilim Dalı
dc.identifier.yokid359027
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityMUĞLA ÜNİVERSİTESİ
dc.identifier.thesisid258853
dc.description.pages126
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess