Koroner arter hastalığının risk faktörlerinin irdelenmesinde alternatif bir yaklaşım: Genetik algoritmalar
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bilgisayar uygulamalarının her alanda yaygın olarak kullanıldığı günümüzde, potansiyel olarak depolanan veri hacmi hızla artmaktadır. Özellikle sağlık sektöründe depolanan ancak kullanılmayan bilgilerin hayata geçirilmesi işlemi, büyük önem taşımaktadır. Veri tabanlarında toplanan çok büyük hacimli verilerden, anlamlı bilgilerin elde edilmesi için geliştirilen ve özellikle son yıllarda yaygın kullanım alanları bulan yöntemler veri madenciliği yöntemleri olarak adlandırılırlar. Bu alanda birçok algoritmadan faydalanılmaktadır. Genetik Algoritmalar (GA) yönteminde problemler sanal olarak evrimsel süreçten geçirilir ve bu süreç sonunda en iyi sonucu veren çözüme ulaşılmaya çalışılır.Bu çalışmada, GA ile optimize edilerek sınıflama yapılmış olan 20, 50, 100, 500 ve 1000 ağaçlı Random Forest (RF) sonuçları; tek bir Karar Ağacından elde edilen sonuçlarla, GA ile optimizasyon yapılmamış olan 20, 50, 100, 500 ve 1000 ağaçlı RF sonuçlarıyla aynı zamanda da sınıflamalara etki eden en önemli 9 değişken temel alınarak sınıflama yapılmış olan 20, 50, 100, 500 ve 1000 ağaçlı RF sonuçlarıyla kıyaslanmıştır.Yapılan bu çalışmadan elde edilen sonuçlardan yola çıkılarak, GA yöntemiyle optimize edilerek kurulan RF modellerinin, optimize edilmemiş olan RF modellerine oranla çok daha yüksek başarıya sahip olduğu söylenebilir. Aynı şekilde RF modellerinin sınıflama başarısını yükseltmesi açısından, ağaç sayısı kaç olursa olsun, kurulacak olan modellerin GA yöntemiyle optimize edilmesi yapılan bu çalışma sonucunda ulaşılabilen en önemli sonuç olmaktadır.nahtar Sözcükler: Genetik Algoritma, Random Forest, Sınıflama ve Regresyon Ağaçları In the present day that computer applications are widely being used in all areas, potentially the data volume being stored is rapidly increasing. Particularly, putting into practice the stored but not used data in the health sector has a great importance. Methods which are developed for obtaining significant informations from huge datas accumulated in data bases, and which are finding wide are of usage particularly in late years, are called data mining. In this area many algorithms are followed up. In Genetic Algorithms (GA) method, problems are virtually undergone an evolutionary process, and at the end of this process it is tried to achieve the solution giving the best result.In this study, 20, 50, 100, 500 and 1000 trees Random Forest (RF) results classified by optimizing with GA were compared with; the results obtained from only one Decision Tree, nonoptimized 20, 50, 100, 500 ve 1000 ağaçlı RF results, at the same time 20, 50, 100, 500 ve 1000 trees RF results classified based on the most important 9 variables affecting the classifications. Setting out from the results of this study, it can be speculated that the RF models optimized by GA method have greater succes than nonoptimized RF models. In the same way, the most important result achieved in this study is that, in terms of increasing the succes in classification of RF models, optimizing the established models by GA method irrelevant from the number of trees.Key Words: Genetic Algorithms, Random Forest, Classification and Regression Trees
Collections