Thyroid disorders prediction using long short term memory (LSTM) technique with non dominated sorting genetic algorithm (NSGA-II) as risk factor feature determination
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Veri bilimi, diğer teknoloji ve mühendislik üreticilerinin yoğun ilgi gösterdiği evrimsel bir alandır. Veri biliminin en popüler görevlerinden biri, büyük bir veriyi analiz ederek bilginin çıkarılmasıdır, buna veri madenciliği adı verilir. Geleneksel matematiği kullanarak bilinmesi mümkün olmayan büyük verilerden gizlenmiş kalıpları ortaya çıkarır. Tıbbi uygulama bu gelişmelerin arkasında değildir, veri madenciliği tesisleri de tıbbi amaç için kullanılmaktadır ve büyük verilerin madenciliğinde ve hastalık tahmini, hasta kümelenmesi, ilaç sınıflandırması, gelecekteki talep tahmini vb. Gibi önemli bilgileri açığa çıkarmada gözle görülür bir performans göstermektedir. Proje tiroid enfeksiyonu tahmini için veri madenciliği algoritmaları kullanıyor. Veri seti hazırlama, farklı hastalardan 2800 tıbbi kayıt gibi temel önkoşullar içeren projeler çevrimiçi portaldan alınmakta ve ön işlemler eksik değerleri değiştirmek ve metin bilgilerini sayısal formatta şifrelemekle başlamaktadır. İleri Beslemeli Sinir Ağı (FFNN), hastalık oluşumunu tahmin etmek için bu veri setinden öğrenmek üzere yapılır. Dahası, aynı veri setinden hastalık oluşumunu tahmin etmek için derinlemesine öğrenme kullanılır, aynı şeyi öğrenmek için daha büyük olasılıkla Uzun Kısa Süreli Bellek Sinir Ağı (LSTM NN) kullanılır. Sonuçlar, iki teknik arasındaki eğitim performansının karşılaştırılmasıyla yapılmıştır. Performans, Ortalama Kare Hatası'ndaki (MSE) hakim durum ve en iyi yaklaşıma ulaşmak için her biri tarafından alınan çağ sayısıdır. FFNN kullanmanın kazandığı en iyi maliyet (0.09659583) idi, oysa LSTM çoklu yinelemelerden sonra minimum performansı üretti. ayarlarından daha büyük olasılıkla bir (0.03916952) ortalama kare hatası LSTM kullanılarak elde edilen minimal hatadır. Data science is evolutional field that gained extensive attention of other technology and engineering manufacturers. One of the most popular task of data science is extraction of knowledge by analyzing a big data, it is so called as data mining. It uncovers the hidden patterns from big data that are impossible to be known using traditional calculus. Medical application is not behind these developments, data mining facilities are deployed for medical purpose as well and drawn a noticeable performance in mining the big data and revealing important information such as disease prediction, patients clustering, drugs classification, future demand prediction, etc. This project is employing of data mining algorithms for prediction of thyroid infection. Projects included essential requisites such as dataset preparation, a 2800 medical records of different patients are resourced from online portal and preprocessing are begin with substituting the missing values and encrypting the text information into numerical format. Feed Forward Neural Network (FFNN) is made to learn from this dataset for predicting the disease occurrence. Furthermore, deep learning is exploited to predict the disease occurrence from the same dataset, more likely Long Short-Term Memory Neural Network (LSTM NN) is used to learning the same. The results are made by comparison the performance of training between the two techniques. Performance is judge base on the Mean Square Error (MSE) and number of epochs taken by each to reach the best approximation. The best cost gained from using the FFNN was as (0.09659583) whereas the LSTM has produced the minimal performance after multiple iterations of its setting, more likely a (0.03916952) mean square error is the minimal error obtained using the LSTM.
Collections