Veri madenciliği yöntemleri ile ankilozan spondilit hastalığında radyografik progresyona etkili faktörlerin analizi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bilgi ve iletişim teknolojilerinde yaşanan gelişmeler, birçok alanda olduğu gibi sağlık alanında da mevcut verilerden yeni bilgi keşfinin kapılarını aralamaktadır. Özellikle veri madenciliği teknikleri, tıbbi verilerin analizinde sağlık çalışanlarına yeni bir ışık tutmaktadır. Bu nedenle son yıllarda sağlık alanında, özellikle hastalıklarla ilgili verilerin analizinde bu teknikler sıklıkla kullanılmaya başlanmıştır. Romatizmal bir hastalık olan ve bireye göre hastalığın seyrinin çeşitlilik gösterdiği Ankilozan spondilit hastalığına ait veri setleri de bu tekniklerin aydınlatmasına ihtiyaç duymaktadır. Bu tez çalışmasında veri madenciliği sınıflandırma algoritmaları kullanılarak, Ankilozan spondilit hastalığına sahip bireylere ait veri seti ile hastalığın radyografik progresyonuna etki eden faktörlerin analiz edilmesi amaçlanmıştır. Çalışmada sınıflandırma karar ağaçları algoritmalarından C4.5, Gini, Regresyon ağaçları ve Random Forest algoritmaları kullanılmıştır. C4.5, Gini, Regresyon ağaçları algoritmaları ile karar ağacı modelleri oluşturulup grafiksel olarak görüntülenmiş, Random Forest algoritması ile tahmin doğruluğu incelemesi yapılmıştır.Yapılan analizler sonucunda en yüksek sınıflandırma ve model doğruluk oranı Gini algoritması sonucu oluşturulan modelde %82 olarak bulunurken, C4.5 algoritmasında 78.7 ve regresyon ağaçlarında %74 olarak bulunmuştur. Ayrıca rasgele orman algoritmasının sınıflandırma başarı tahmini %83.11 olarak bulunmuştur. Cinsiyet, hastalık süresi, servikal tutulum, hastalığın başlangıç yaşı ve IL23rs11209032 (AA veya AG) progresyona etkili faktörler arasında bulunmuştur. Gerçek tıbbi veriler kullanılarak üretilen sonuçlar karar vermede yardımcı model olarak kullanılabilir. Çalışmanın daha ileriye taşınabilmesi için hastalara ait veri girişlerin eksiksiz olarak girilmesi, kayıt sayısının arttırılması gerektiği düşünülmektedir. Developments in information and communication technologies pave the way for discovery of new knowledge from existing data in the health fields as in many areas. Especially data mining techniques lead the way analysis of medical data to health professionals. Therefore, in the health field in recent years, particularly in the analysis of data related to the disease, these techniques have been used frequently. Data sets that has got Ankylosing spondylitis which is a rheumatic disease and progress of the disease vary according to the individual also requires illumination of these.In this thesis using data mining classification algorithms, with individuals who have the disease of Ankylosing spondylitis of the data set is intended to analyze the factors affecting the radiographic progression of the disease. In the study, classification decision tree algorithms which are C4.5 Gini, regression trees and Random Forest algorithm is used. C4.5 Gini, regression trees algorithms imaged decision tree models created graphically and Random Forest algorithm analysis accuracy of the estimate is made.The analysis and model results in the highest classification accuracy rate of 82% in the model were found as a result created the Gini algorithm, C4.5 algorithm was found to be 74% in 78.7 and regression trees. In addition, random forest classification algorithm success has been estimated as 83.11%. Gender, duration of disease, cervical involvement, the age of onset of the disease and IL23rs11209032 (AA or AG) was found among the factors to progression. The results produced by using real medical data can be used as a model helps in decision making. All of the input data to be entered as the patient to be moved further to the study, it is considered necessary to increase the number of records.
Collections