Sağlık sektöründe veri madenciliği
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İçinde bulunduğumuz çağda neredeyse tüm şirketler ve kamu kuruluşları bir çok veri üretip depolamaktadırlar. Dünya çapındaki tüm hastaneler de hastalara ait birçok veriyi oluşturup kaydetmektedir. Türkiye'de Hastane Bilgi Yönetim Sistemlerinde bulunan bu çok miktardaki verinin amacı mükerrer işlemlerin önüne geçerek hastalara daha iyi hizmet verebilmektir. Bu verilerden daha iyi faydalanmak ve erken teşhisin önemli olduğu hastalıkları ölümcül aşamaya gelmeden önce belirli doğruluk oranlarıyla tahmin edebilmek bazı istatistiksel ve veri madenciliği yöntemleriyle mümkün olabilmektedir. Fakat bu veriler genellikle temel sorgulamalar için kullanılmaktadır. Bu tez çalışmasında istatistiksel metotlar ve veri madenciliği teknikleriyle ince iğne aspirasyon biyopsisi tekniği (FNA) ile elde edilen verilerle meme kanserinin önceden tahmin edilmesi ve kötü sonuçlarla karşılaşılmadan hastanın tedavi sürecine alınması amaçlanmıştır.Uygulama bölümünde ID3, C4.5, Random Forest, CART, LMT, Naive Bayes, Logistic Regression, KNN, SVM ve ANN algoritmaları kullanılmış ve yapılan analiz neticesinde yöntemlerin başarılı olup olmadıkları değerlendirilmiş ve en iyi sonucu veren algoritma tespit edilmeye çalışılmıştır. Sonuç olarak Naive Bayes algoritması ile %97.4 doğruluk oranına ulaşılmış ve veri madenciliği teknikleriyle meme kanseri teşhisi çoğu vakada cerrahi biyopsiye ihtiyaç duymadan başarılı bir şekilde yapılabilmektedir. In present age almost all companies and public institutions produce and store a lot of data. All hospitals around the World also create and record many data about their patients. In Turkey the data that is stored in the Hospital Information Management System is just used for to prevent duplicate procedures. The purpose of this excessive data in hospitals is to serve patients better. To make better use of these data and to predict diseases before mortal phase with certain accuracy rates can be possible with some statistical and data mining methods. But this data is just used for basic inquiries.In this thesis, it is aimed to predict breast cancer with statistical methods and data mining techniques and to put the patients into treatment process without and bad results using the data that is obtained by fine needle aspiration biopsy technique.In the application section, ID3, C4.5, Random Forest, CART, LMT, Naive Bayes, Logistic Regression, KNN, SVM and ANN algorithms were used and as a result of the analysis it is tried to determine which methods are more successful. As a result, Naive Bayes algorithm reached the success with the accuracy rate of %97.4. Breast cancer prediction can be accoplished succesfully in most cases with no need to surgical biopsy by data mining techniques.
Collections