Sağlık alanında yapılan araştırmalarda kümeleme algoritmalarının kullanımı: Bir uygulama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Kümeleme yöntemleri ile benzer özelliklere sahip değişken ve bireyler bir grupta toplanabilmektedir. Birçok uygulama alanına sahip olmasına rağmen kümeleme yöntemi ülkemizde sağlık araştırmalarında nadir olarak kullanılmaktadır. Bu tez çalışmasının amacı, farklı kümeleme algoritmalarını tanıtmak ve bu algoritmaların nasıl ve hangi durumlarda doğru bir şekilde kullanılabileceğini göstermektir. Aynı zamanda sağlık alanından elde edilmiş gerçek bir veri seti üzerinde uygulanabilir olan farklı kümeleme algoritmalarının sonuçlarını karşılaştırmaktır. Yapılan değerlendirmeler sonucunda kullanılan iki farklı veri seti için hesaplanan kappa katsayıları istatistiksel olarak orta düzeyde anlamlı bulundu. Gerçekleştirilen uygulama sonucunda her iki veri seti için de kappa katsayısı bakımından en uygun ve en hızlı sonuçlar üreten algoritmanın En Uzak İlk Kümeleme Yöntemi olduğu sonucuna varıldı. Framingham risk grupları ile oluşturulan kümeler arasında çapraz tablolar oluşturularak grupların dağılımı incelendiğinde ise, en isabetli kararların Make Density Based ve EM algoritmalarıyla elde edilen kümeleme sonuçları olduğu görüldü. Sonuç olarak kümeleme yöntemlerinin hastalıklara ait risk faktörlerinin incelenmesinde, klinik bilgileri de dikkate alarak hastalık gruplarının oluşturulmasında ve buna bağlı olarak da doğru hastalık teşhislerinin konulmasında önemli bir yol oynacağı düşünülmektedir. Ayrıca veri dağılımı ve özellikleri dikkate alınarak kullanıldığında kümeleme algoritmalarının, sağlık alanında her türlü planlama ve hastalık teşhisi için bir tanı aracı olarak kullanılabileceği kanısındayız. With clustering methods variable and individuals which have similar characteristics may be collected in a group. Although clustering methods have many applications, there are limited studies in health researchs in our country. While the purpose of this study is to introduce different clustering algorithms and show how and which cases shoul be correctly used. At the same time, different clustering algorithms results which can be applied on a real data set were compared. According to the evaluations, for two different data sets the kappa coefficients were statististically significant and its degree are intermediate. In terms of both data sets the most convenient and fastest algorithm is farthest clustering algorithm. The results obtained by Make Density Based and EM algorithms gave the most accurate desicions in terms of the distribution of the groups among Framingham risk groups crosstables. As a result, with taking into account the criterion of clinical information it is thought that the examination of clustering of risk factors of the disease, will be played an inportant role for intorduction of accurate disease diagnosis. In addition we believe that when considering data distribution and characteristics of data sets clustering algorithms can be used as a diagnostic tool for the plannings and diagnosis of diseases in the field of health.
Collections