Data mining based decision support system using data warehouse
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günden güne artan veri miktarı nedeniyle veri ambarı ve veri madenciliği, yaşamın her alanında kullanılmaya başlanmıştır. Özellikle sağlık sektörü bilgiye dönüştürülmeyi ve değerlendirilmeyi bekleyen çok fazla miktarda veri barındırmaktadır. Veri ambarı ve veri madenciliği tekniklerinin entegrasyonu ile bu verilerden doktorların ve yöneticilerin karar verme sürecini destekleyen bilgilerin açığa çıkarılması mümkün olabilmektedir. Bu çalışmada Amerikan Ulusal Kanser Enstitüsü'nden (NCI) alınan akciğer kanseri verileri hatalardan ve tekrarlardan arındırılarak veri ambarı modelinde tutulmuştur. Veri ambarı tasarlanırken çok boyutlu veri modelleme yaklaşımlarından yıldız şema modeli kullanılmıştır. Oluşturulan modelin yazılan karmaşık sorgulara yanıt verebildiği görülmüş ve sonuçları sunulmuştur. Veri ambarındaki veriler üzerinde Naive Bayes, K-Nearest Neighbors, C4.5 sınıflandırma algoritmaları uygulanmıştır. Uygulanan algoritmaların sonuçları karşılaştırılarak C4.5 algoritmasının daha başarılı sonuç verdiği görülmüştür. Sınıflandırma işlemi akciğer kanseri hastasının hayatta kalma durumuna göre yapılmıştır. C4.5 ile üretilen karar ağacından akciğer kanseri hastalarının hayatta kalma olasılığı ile ilgili çeşitli kurallar elde edilmiştir. Çalışmanın sonraki aşamasında, elde edilen karar ağacı modeli kullanılarak doktorlara karar verme aşamalarında destek sağlayacak web tabanlı örnek bir sistem geliştirilmiştir.Kanser verilerinin büyüklüğü ve karmaşıklığı düşünüldüğünde veri ambarı ve veri madenciliğinin birlikte kullanılmasıyla kurulan bu karar destek sistemi, doktorların tedavi süreçlerini şekillendirmesinde onlara ışık tutabilecektir. Data warehousing and data mining have begun to be used in every aspect of life because of the increasing amount of data. Especially the health sector has a lot of data that needs to be converted into knowledge and to be evaluated. With the integration of data warehouse and data mining techniques, it is possible to expose information that supports the decision-making process of doctors and administrators.In this study, we have created a data warehouse for lung cancer data that received from American National Cancer Institute (NCI). The lung cancer data have brought into certain formats, cleaned from errors and repetitions. The star schema model was used; hence the data warehouse is designed to respond to even the most complex queries. Then Naive Bayes, K-Nearest Neighbors, C4.5 classification algorithms were applied for the data in the data warehouse. By comparing the results of the applied algorithms, it is seen that the C4.5 algorithm is more successful than other algorithms. The classification process is based upon the survival of the lung cancer patient. The decision tree produced by C4.5 has provided various rules regarding the likelihood of survival of lung cancer patients. At the next stage to the study, a web-based prototype system was developed to provide support to physicians in the decision-making process using the decision tree model obtained.When considering the size and complexity of cancer data, a decision-support system built with both data warehouse and data mining can shed light on the treatment process for doctors.
Collections