Karışımlı model yaklaşımının sınıflandırma amaçlı kullanılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Karışımlı modellemede amaç, bir veri setindeki gözlenemeyen heterojenliği belirleyerek, örneklemin kaç alt populasyona ait olduğunu tespit etmektir ve her alt populasyon için ayrı ayrı parametre tahmini yapmaktır. Karışımlı modeller, değişkenler arasındaki ilişkileri tanımlamada ve çoklu kaynaklardan toplanan verileri modellemede kullanışlıdır. Karışımlı model yaklaşımı birçok farklı probleme uyarlanabilen son derece esnek bir kümeleme algoritması sunmaktadır. Normal karışımlı modellerde (Gaussian mixture models=GMM) en temel amaç, doğru alt grup sayısını belirlemek yani, heterojen bir grupta homojen kaç tane alt grup oluşturulacağına karar vermektir. Normal karışımlı modellerde uygun model seçimi için bilgi ölçütleri kullanılmaktır. GMM' de alt grup sayısının küçük tutulmasına yardımcı olmak ve farklı alt grup modellerine sahip modeller arasında seçim yapmak için Akaiki ve Bayesian uyum ölçütleri yaygın olarak kullanılmaktadır. Bu çalışmada, 2013 yılında, illere göre mutluluk kaynağı olarak; çocuklar, eş, anne/baba, kendisi, torunları, sağlık, sevgi, başarı, para ve iş gibi değişkenler kullanılarak Türkiye'deki illerin mutluluk haritası elde edilmiştir. Başka bir ifadeyle, normal karışımlı model kullanılarak Akaiki, Bayesian ve entropy uyum istatistikleri kullanılarak Türkiye'deki illerin kendi içlerinde homojen ve aralarında heterojen olmak üzere 6 alt grup oluşturulacağı saptanmıştır. Çocukları mutluluk kaynağı olarak görmeyen illerin başında Mardin gelmiştir. Bu ili Doğu Anadolu ve Güneydoğu Anadolu, Karadeniz Bölgelerindeki iller izlemiştir. Eşi mutluluk kaynağı olarak gören iller diğer illere nazaran oldukça yüksek bir ortalama değer ile Ağrı, Bitlis ve Muş olmuştur. Genellikle Doğu Anadolu ve Güneydoğu Anadolu Bölgeleri sağlık durumunu mutluluk kaynağı olarak pek görmedikleri sevgiyi ise diğer bölgelere nazaran mutluluk kaynağı olarak gördükleri sonucuna ulaşılmıştır.Anahtar kelimeler: Akaiki, Bayesian, Entropy, Karışımlı model, Normal Karışımlı Model. Mixture modelling is identification of the amount of homogeneous subsets by determining the unobservable heterogeneity in that data set. Thus, homogeneity within subgroups and heterogeneity among subgroups are achieved. Akaiki, Bayesian and entropy information criteria are used to determine the number of subgroups. In mixture modelling, the parameter estimations are obtained by the maximum likelihood method using the EM algorithm. Mixture modelling is used to define relationships between variables, to reduce the size, and to estimate the individual parameters for each subset obtained. This method gives more explanatory results than clustering and factor analysis. Mixture modelling is applied to both discrete and continuous data. Normal mixture modelling is used when the data show normal distribution.In this study, the happiness map of the provinces in Turkey (2013) was obtained by using variables such as children, spouse, parents, the individual himself, grandchildren, health, love, success, money and job as a source of happiness. In other words, by using the normal mixture model, provinces were formed as 6 subgroups. This is applied according to the defined criteria of happiness; homogeneous within themselves, and yet heterogeneous among themselves. For each subgroup, the parameter estimation values were also obtained. Mardin is the first among the provinces that does not consider children as a source of happiness. This province is followed by the provinces in Eastern Anatolia, South-eastern Anatolia and the Black Sea Region. The provinces that take the spouse as a source of happiness with the highest average are Ağrı, Bitlis and Muş. It is found that generally, Eastern Anatolia and South-eastern Anatolia regions do not consider health status as a source of happiness and they consider love as a source of happiness when compared to other regions.Keywords: Akaike, Bayesian, Entropy, Mixture Model, Normal Mixture Model.
Collections