Mixture model based data clustering
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışma, bir popülasyondaki karmaşık heterojenlik özellikleriniaraştıran kümeleme tekniklerine dayalı karma modellerin incelenmesi üze-rindeyoğunlaşmıştır. Hem parametrik hem de parametrik olmayan karma modellerfarklı durumlarda incelenmiştir. Özellikle Poisson karma regresyon modellerive Sıfır ¸şişirilmiş Poisson karma modelleri parametrik durum için incelenirkenGauss çekirdek yoğunlukları da parametrik olmayan durum için incelenmiştir.Parametrik karmalar, kümeleri ve bile¸senleri aynı varsayarken, bunlar parametrikolmayan durum için voronoi diagramları ve sonsuz bile¸sen modelleri aracılığı ilegrafik teori teknikleri kullanılarak farklı şekilde gözlemlendi. Karma modeller kullanılandaha iyi kümeleme yöntemleri kümeleme analizi yolu ile sınıflandırılarakbelirlendi. Sonuçlara göre, parametrik ve parametrik olmayan karmalardakikümelerin sayıları aynı olmalarına rağmen bu yaklaşımlar genellikle çok farklıdır.Parametrik olmayan karışılar, sınıflandırıcı performansını arttrıma ve dolayısıylaheterojeliği daha verimli bir şekilde sıkıştırma yenetenekler ile kanılandığı üzeredaha iyi kümeler üretir. Bu nedenle, karma modellere, geleneksel kümelemeyönetemleri üzerindeki yoğunluklar ve parametreler yoluyla küme özelliklerindeçkarımlara izin verme yeteneği onları daha iyi kümeleme yönetemleri halinegetirir. Parametrik olmayan karma daha sağlam, esnek ve daha iyi kümelerürettikleri için parametrik olarak tercih edilmelidir The study focused on exploring the use of mixture models for data clusteringtechniques on data with complex heterogeneous properties. Both parametricand nonparametric mixture models were here considered. In particular, Poissonmixture regression models and Zero Inflated Poisson mixture models were appliedand analysed for the parametric case as mixtures of Gaussian kernel densities wereconsidered for the nonparametric case. Although, parametric mixtures assumeclusters and components to be the same, these are observed different by either usinggraph theory techniques via voronoi diagrams or infinite componential models inthe nonparametric case. Determination of better clustering method using mixturemodels was enabled through classification via clustering analysis. Results showsthat although number of clusters from the parametric mixtures can be the samewith nonparametric, these approaches are generally very different. Nonparametricmixtures produce better clusters as evidenced by their ability to improve classifierperformance and hence compacting heterogeneity in a more efficiently way whilstparametric are a bit rigid. The ability by mixture models to allow inferences oncluster properties via densities and parameters over traditional clustering methodsmakes them a better clustering methods. We conclude that although mixturemodels are better than hierarchical models, nonparametric mixture should bepreferred over parametric as they are more robust, flexible and produce betterclusters.
Collections