Post operative prognostic prediction of esophageal cancer cases using bayesian networks and support vector machines
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tezin amacı, tıbbi bir veri setini sınıflandırmak için bir dizi etkili sınıflandırma modelini geliştirmek ve performanslarını analiz etmektir. Genellikle, veri madenciliğinde, mevcut verileri açıklamak için, yapay zeka, istatistik, optimizasyon, veri tabanı teorisi gibi çeşitli alanlardan gelen algoritmaları kullanılır. Bu çalışmada, Destek Vektör Makinesi ve Bayes Ağ yöntemleri kullanılmaktadır. Analiz verileri, 2003 ve 2011 yılları arasında bir özefajektomi operasyonu geçirmiş özofagus kanserli hastaların klinik patoloji kayıtlarıdır. Hastaların prognozlarına göre sınıflandırılabilmeleri için prognostik olarak etkili olabilecek büyük grup faktör analiz edilmiştir. Bu faktörlerden tahminde etkili bulunanlar yaş, cinsiyet, disfaji, odinofaji, kilo kaybı, kusma, bulantı, patolojik N, patolojik T, FEV1, tümör derecesi, tümör boyu olmuştur. Yapılan sınıflandırma deneylerinde, Destek Vektör Makinesi %72.38 öğrenme doğruluğu ve çapraz-doğrulama ile %70.58 genelleme başarısı görülmüştür. Destek Vektör Makinesi ilk yöntem olarak kullanıldı ve PCA ile desteklendiğinde en iyi doğruluk oranı elde edildi; SVM düzensiz dağılan ve tam modellenemeyen verilerin analizi için doğru sınıflandırıcı üretebilir. Bayes Ağı önceki yöntemde eksik veri sorununu çözmek için, bu çalışmada kullanılan ikinci yöntemdir. Bayes Ağları aynı anda birkaç farklı değişken türde sınıflandırabilir. Bu çalışma için oluşturulmuş ağ sonuçlarının kalitesi modelin kalitesine bağlıdır. Bu çalışmada kullanılan Bayes ağı modelinin doğruluğu 119 hasta için %73.10 dir. The objective of this thesis is to develop and analyze the performances of a number of classifiers in prognosis classification based on a medical history data set. Generally, data mining uses algorithms originating in different disciplines such as artificial intelligence, statistics, optimization, database theory etc., to clarify available data. In this study, Support Vector Machine and Bayesian Network methods have been used. The data analyzed are clinical pathology records of patients with esophageal cancer who received an esophagectomy operation between 2003 and 2011. A large number of prognostic factors have been considered to classify the patients on prognosis. These factors found to be predictive were age, sex, dysphagia, odynophagia, lost weight, vomit, nausea, pathological N, pathological T, FEV1, tumor grade and tumor length. Classification trials for Support Vector Machine have shown %72.38 training accuracy with a generalization accuracy of %70.58, which was established by cross-validation. Support Vector Machine was used as the first method for data and SVM was found to achieve good accuracy on a data set of 119 patients when used in conjunction with PCA; SVM can be helpful for black-box analysis when data are irregularly distributed and produce accurate classifiers. Bayesian Network is the second method that is used in this study to solve missing data problem in the previous method. Bayesian Network can classify several different types of variables simultaneously. The quality of the results of the network that has been created for this study depends on the quality of the model. Performance of the model with Bayesian Network that is used in this study is 73.10% for 119 patients.
Collections