Koroner arter hastalarında hipertansiyonun sınıflandırılması için dengesiz sınıf probleminin tıbbi bilgi keşfi süreci ile giderilmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Amaç: Bu çalışmanın birinci temel amacı, Koroner arter hastalarında mortalite ve morbiditenin artma nedenlerinden biri olan hipertansiyonun, çeşitli risk faktörleri yardımıyla Tıbbi Bilgi Keşfi Süreci uygulanması suretiyle tahmin edilmesi (sınıflandırılması) dir. Çalışmada kullanılan veri setinin bağımlı değişkeni olan hipertansiyonun sınıf dengesizliği probleminin olması nedeniyle, sınıflandırma işlemi yapılmadan önce bu probleminin giderilmesi için çeşitli yaklaşımları kullanan ve ara yüzü Türkçe olan bir web-tabanlı yazılımın geliştirilmesi bu çalışmanın ikinci temel amacıdır.Materyal ve Metot: Çalışmada kullanılan veri seti, 149'u (%16) hipertansiyonu bulunan, 780'i (%84) hipertansiyonu bulunmayan toplam 929 koroner arter hastası kayıtlarından oluşmaktadır. Koroner arter hastalarında hipertansiyonun sınıflandırılması 8 adet bağımsız değişkene dayalı olarak yapılmıştır. Dengesiz sınıf problemini gidermek için çeşitli alt örnekleme, üst örnekleme ve hem alt hem de üst örnekleme yöntemleri kullanılmıştır. Sınıflandırma yöntemleri olarak Çok Katmanlı Algılayıcı, Aşırı Öğrenme Makinesi ve Destek Vektör Makineleri modelleri uygulanmıştır.Bulgular: En iyi sınıflandırma performansının, DBSMOTE sınıf dengeleme yöntemi uygulandıktan sonra Destek Vektör Makinesi modeli ile elde edildiği görülmüştür. İlgili modelin, doğruluk, duyarlılık, seçicilik, kesinlik, f-ölçümü ve g-ortalama değerleri sırasıyla, 0.99, 0.99, 0.99, 0.95, 0.97 ve 0.97 olarak hesaplanmıştır.Sonuç: Çalışmada uygulanan üst örnekleme yöntemlerinin, alt örnekleme yöntemlerine göre modellerin sınıflandırma performanslarına belirgin bir şekilde olumlu katkı yaptığı görülmüştür. Bu çalışma kapsamında yer almayan ancak ilerleyen çalışmalarda ele alınacak olan; hibrit yöntemleri, Maliyet-Duyarlı Öğrenme Tabanlı Yöntemler, Topluluk Öğrenme Tabanlı Yöntemler, Öznitelik Seçimi Tabanlı Yöntemler, daha sağlam ve tutarlı sonuçlar elde edilmesi açısından okuyuculara önerilebilir.Anahtar Kelimeler: Dengesiz sınıf problemi, alt-üst örnekleme yöntemleri, hipertansiyon, tıbbi bilgi keşfi süreci, koroner arter hastalığı. Aim: The primary aim of this study is to estimate (classify) hypertension, one of the causes of mortality and morbidity increase in coronary artery disease patients, by applying Medical Knowledge Discovery Process with various risk factors. Because of the class imbalance problem of hypertension, which is dependent variable of the dataset used in the study, the development of a web-based software which uses various approaches to resolve this problem before the classification process and whose interface is Turkish is the second main aim of this study.Material and Method: The dataset used in the study consisted of records of 929 coronary artery patients with 149 (16%) hypertension and 780 (84%) non-hypertension. Classification of hypertension in coronary artery patients was done based on 8 independent variables. Various over-under sampling and both over and under sampling methods was used to handle the imbalanced class problem. As the classification methods, Multilayer Perceptron, Extreme Learning Machine and Support Vector Machine models were performed.Results: The best classification performance was obtained by the Support Vector Machine model after applying the DBSMOTE class balancing method. The accuracy, sensitivity, specificity, precision, f-measure and g-mean metrics of the relevant model were calculated as 0.99, 0.99, 0.99, 0.95, 0.97 and 0.97, respectively.Conclusion: Compared to the undersampling methods, the oversampling methods used in the study showed a positive contribution to the classification performance of the models. Hybrid Methods, Cost-Sensitive Learning Based Methods, Ensemble Learning Based Methods, Feature Selection Based Methods, which aren't included in the scope of this study but will be discussed in further studies, can be suggested to readers for more robust and consistent results.Key Words: Imbalanced class problem, over and under sampling methods, hypertension, medical knowledge discovery process, coronary artery disease.
Collections