n<p boyutlu biyolojik verilerde farklı kümeleme yöntemlerinin karşılaştırmalı olarak incelenmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Araştırma, n<p boyutlu olan, 24 farklı Antepfıstığı (Pistacia vera L.) tipi ve bu tiplerden alman 38 adet değişken üzerinde yapılmıştır. Ancak bu tip bir veri matrisine kümeleme analizine ilişkin bazı çok değişkenli test istatistiklerinin uygulanabilmesi için değişken sayısının (n^p) azaltılması gerekmektedir. Değişken sayısının azaltılmasında Ana Bileşenler (Principal Component) analizi, Ayırma (Diskriminant) analizi ve Korelasyon analizinden yararlanılmıştır. Sözü edilen metotlarla indirgenen değişkenler, farklı kümeleme metotlarıyla karşılaştırmalı olarak incelenmiştir. Sonuçta, kümelemede en uygun yöntemin Ana Bileşenler analizi ile birlikte kullanılan Ward metodunun olduğu belirlenmiştir. Küme sayısının belirlenmesinde ise en uygun ölçütün Cmax, Wilks Lambda ve Hotelling Lawley İz istatistiklerinin olduğu belirlenmiştir.ANAHTAR KELİMELER: Kümeleme Analizi, Sayısal Sınıflandırma, Ana Bileşenler Analizi, Ayırma Analizi, Korelasyon Analizi. This research was carried out on 38 variables taken from 24 types of pistachio (Pistacia vera L.) with n<p dimensions. However, in order to apply the some multivariate test statistics of clustering analysis to this type data matrix, the number of variables (nâ:p) must be decreased. For decreasing the number of variables, analysis of principle components, analysis of Discriminant and analysis of Principal Components and analysis of Correlation were used. Variables decreased by the methods mentioned above, was comparatively examined by different clustering methods. As a result it was shown that the most suitable method for clustering is the Ward method used with Principle Components analysis. Also it was concluded that the most suitable scales (measurement) to determine the number of clusters are Wilk's Lambda, Cmax and Hotelling Lawley Trace statistics. KEYWORDS: Cluster Analysis, Numerical Taxonomy, Principal Component Analysis, Discriminant Analysis, Correlation Analysis.
Collections