Veri madenciliği ile kanser tanısı
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Veri kavramı tüm dünyada her zaman oldukça önemli bir mesele olmuştur. Bilimsel ya da günlük yaşamın her diliminde, sık sık, faydalı bilgi elde etmek üzere veriler kullanılmıştır. Önceleri eldeki veriyi gözeterek bir analiz yapmak oldukça kolay, bazı giriş verileri mevcutken bir sonucu (çıktıyı) tahmin etmek daha basitti. Fakat şimdilerde, elde edilen veriye bakarak bir sonuca varmak zorlaşmıştır. Bu da demek oluyor ki, son zamanlarda, veriyi bilgiye çevirmek biraz daha karmaşık bir hal almıştır. Sürekli büyüyen dünya veri yığınlarını da büyütmüş ve onu kullanmayı, depolamayı ve yönetmeyi de aynı oranda zorlaştırmıştır. Günümüzde, ucuzlayan teknoloji sayesinde veriler kolaylıkla depolanabilmekte ve pek çok veritabanı yönetim sistemi ile de mümkün olduğunca yönetilebilmektedir. Bu gelişmelerden sonraki problem ise bunca verinin nasıl analiz edileceği ve böylesine kütlelerdeki veri yığınları arasından nasıl bir sonuca varılacağı konusudur. Veri madenciliği kavramının doğuşunu işte bu problem tetiklemiştir.Bu çalışmada, sağlık sektörüne veri madenciliği ile katkıda bulunmak amaçlanmıştır. Çalışmada hastalara kanser tanısı koymaya yönelik bir analiz yapılmıştır. Bu amaçla, öncelikle, daha önceden kanser teşhisi konmuş hastaların verileri toplanmış ve düzenlenmiş, daha sonra da bu verilerden yararlanılarak başka hastaların hangi kansere yakalandıkları tahmin edilmeye çalışılmıştır. Verilerin düzenlenmesi ve madenciliğe hazırlanması aşamasında MySQL VTYS ve PHP programlama dili kullanılmıştır. Veriler hazırlandıktan sonra istenen algoritmaya göre veri madenciliğini gerçekleştirmek üzere RapidMiner 5.0 aracı kullanılmıştır. The concept ?data? was always an important issue around the world. In every slice of scientific or daily life, data is frequently used to obtain useful information. Before, it was quite easy to make an analysis considering the data on hand, i.e. it was simpler to predict a result when some input data is known, but nowadays, it is not so much easy to come to a point after looking the data obtained. This means nowadays the conversion from data to information is some more complicated. Growing world makes the stack of data greater, and makes it much more difficult to store, manage, and use. Thanks to the cheapening technology, data is now stored easily and with several DBMSs data is managed as much as possible. The two disadvantages of the growing world and growing data stack is now eliminated via those improvements. The problem after those improvements is the topic how to analyze that much of data or how to conclude among a huge amount of data. Here is the concept that triggers the rise of data mining.In this study, it is intended to contribute to the health sector with data mining. There is an analysis on cancer diagnoses for the patients in the study. For this purpose, first of all, data about the patients whose cancers? have been diagnosed before and they are arranged, and then which cancer the other patients suffer from is tried to be predicted under cover of those data. MySQL Database Management System and PHP web programming language are used in the arrangement and preparation of the data on hand to data mining. After the data is prepared, RapidMiner 5.0 tool is used to apply data mining with the desired algorithm.
Collections