Meme kanseri hastalarının sağ kalım tahmini için öznitelik seçimi ve sınıflandırma algoritmalarının karşılaştırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Meme kanseri günümüzde özellikle kadınlar arasında en sık görülen hastalıklardan biri haline gelmiş, bu durum da hastaların hayatta kalma tahmininin önemini artırmıştır. Bu çalışmada The Surveillance, Epidemiology, and End Results (SEER) meme kanseri veri seti kullanılarak makine öğrenme algoritmalarının sağ kalım tahmini üzerinde sağladığı başarılar karşılaştırılmış ve öznitelik seçiminin bu algoritmaların başarısı üzerinde sağladığı etki incelenmiştir. Çalışmanın ilk aşamasında veri setindeki sağ kalım tahmini için anlamlı olabilecek özniteliklerin tamamı kullanılarak 4 farklı makine öğrenme algoritması bu veri seti üzerinde Waikato Environment for Knowledge Analysis (Weka) ortamında çalıştırılmıştır. Bunlar: Naive Bayes, J48, Çok Amaçlı Evrimsel Bulanık Sınıflandırıcı (ÇAEBS), Destek Vektör Makineleridir (DVM). En başarılı algoritma olarak J48 algoritması belirlenmiştir. Çalışmanın ikinci aşamasında ise filtre ve sarmalama öznitelik seçim yöntemleri birlikte kullanılarak elde edilen veri setleri üzerinde ilk aşamada kullanılan sınıflandırma algoritmaları test edilmiş ve başarıları karşılaştırılmıştır. Daha az öznitelikle daha yüksek başarılar elde edilebildiği gözlemlenmiştir.Anahtar Sözcükler: Meme kanseri, Öznitelik seçimi, Sağ kalım, Sınıflandırma algoritmaları Breast cancer has become one of the most common diseases, especially among women, increasing the importance of predicting survival. In this study, the success of machine learning algorithms on survival prediction was compared using the Surveillance, Epidemiology, and End Results (SEER) breast cancer data set and the effect of attribute selection on the success of these algorithms was examined. In the first stage of the study, 4 different machine learning algorithms were run on this data set in Waikato Environment for Knowledge Analysis (Weka) using all of the attributes that might be meaningful for survival estimation in the data set. These are: Naive Bayes, J48, Multiobjective Evolutionary Fuzzy Classifier (MEFC), Support Vector Machines (SVM). The most successful algorithm is J48 algorithm. In the second stage of the study, the classification algorithms used in the first stage were tested on the data sets obtained by using filter and wrapping attribute selection methods together and their successes were compared. It has been observed that higher achievements can be achieved with less attribute.Keywords: Breast cancer, Feature selection, Survival, Classifications algorithms
Collections