Makine öğrenimi yöntemlerini kullanarak evre III invaziv duktal karsinomlu hasta verilerinin sınıflandırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
ÖZETAmaç: Tez çalışmasında, danışmanlı makine öğrenimi yöntemleri sınıflama performansına göre kıyaslanarak çalışmada kullanılan yöntemlerin içerisinden, sınıflama başarısı yüksek olan yöntemin bulunması amaçlandı. Gereç ve Yöntem: Çalışmamızda, destek vektör makineleri, rasgele orman ve yapay sinir ağları yöntemlerinin sınıflama performanslarını kıyaslamak için meme kanseri türlerinden biri olan invaziv duktal karsinomlu 302 hastanın sağkalım bilgilerini içeren veri seti ile birlikte simülasyonla elde edilen 24 farklı veri seti kullanıldı. Kullanılan yöntemlerin sınıflama başarıları meme kanseri verilerinde genel doğruluk, duyarlılık, seçicilik, F-ölçütü, Matthews korelasyon kastsayısı, AUC ve ayırsama gücüne göre kıyaslandı. Simülasyon verilerinde ise eğitim-test doğrulukları farkı ve bu farkın anlamlılığı değerlendirildi. Bulgular: İnvaziv duktal karsinom evre III hastalarının test seti için en yüksek sağkalım sınıflama doğruluğu (%80) ve yüksek performans değerlendirme kriteri değerleri radyal çekirdekli destek vektör makinelerinden elde edildi. Simülasyon verilerinde de yüksek sınıflama doğruluğu ve doğruluklar arasındaki farkın küçüklüğü genel olarak destek vektör makinelerinden elde edildi. Sonuç: Destek vektör makineleri hem gerçek veri setinde hem de simülasyon verilerinde, rasgele orman ve yapay sinir ağlarına göre daha yüksek doğruluk oranına sahiptir. ABSTRACTAim: In the thesis study, it was aimed to find the method with high classification success among the methods used in the study by comparing the machine learning methods according to the classification performance.Material and Method: In our study, the data set of 302 patients with invasive ductal carcinoma, one of the breast cancer types, and 24 different data sets obtained by simulation were used to compare the classification performances of support vector machines, random forest and artificial neural network methods. The success of classifications of the methods used were compared according to the general accuracy, sensitivity, specificity, F-measure, Matthews correlation coefficient, AUC and discriminant power in breast cancer data. In the simulation data, the difference between train-test accuracy and the significance of this difference were evaluated.Results: The highest survival classifying accuracy (80%) and high performance evaluation criterion values of the test set of invasive ductal carcinoma stage III patients were obtained from radial kernel support vector machines. In the simulation data, the high classification accuracy and the small difference between accuracies were obtained from the support vector machines in general.Conclusion: Support vector machines have higher accuracy in both the real data set and simulation data than random forest and artificial neural networks.
Collections