Alzheimer hastalığının farklı düzeylerinin sınıflandırılmasında yapay zeka ve logit regresyon modellerinin karşılaştırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Amaç: Demans türleri içinde en sık görülen Alzheimer hastalığı (AH) geri dönüşünü olmayan nörodejenaratif bir hastalıktır. Erken evrelerde tedaviye başlamak günlük işleyişin bir süre korunmasına yardımcı olmaktadır. Tanı için klinik bulgular, görüntüleme yöntemleri, laboratuvar incelemeleri, genetik testler ve nöropsikolojik envanterler, yapay zeka modellerinde hastalığın tespit edilmesine yardımcı olmaktadır. Bu amaçla, AH tanısında kullanılan envanter ve ölçümlerle lojit ve farklı makine öğrenmesi algoritmalarıyla hastalık seviyelerini belirlemek içim modeller kuruldu ve performans ölçütlerine göre değerlendirildi. Farklı senaryolu model sonuçlarının, AH düzeylerini sınıflandırması ve literatüre önerilmesi amaçlandı. Yöntem: Ulusal Alzheimer Koordinasyon Merkezi (NACC) veri tabanından hastalara ait demografik, genetik, nörobilişsel envanter sonuçları ve bunlara eklenen MRG tarayıcılarından hesaplanan beyin hacim/kalınlık ölçümleriyle AH'nin 4 farklı sıralı düzeylerini çoklu karşılaştırma için ince ayarlı farklı mimarili Sıralı Lojistik Regresyon, Rastgele Orman, Gaussian Naive Bayes, XGBoost, LightGBM ve Derin Sinir Ağı modelleri kuruldu. Eğitim ve test veri setleri için ayrılan modellerde, MRG ölçümleri için boyut indirgeme yöntemlerinden LLE ve her sınıftaki örnek sayısının dengesiz dağılımı sorununu gidermek için SMOTE teknikleri kullanıldı. Bulgular: Geliştirilen modellerin doğruluk oranı, F1 skoru, AUC değeri ve her bir sınıfa ait duyarlılık, özgüllük, kesinlik performans ölçütleri arasında benzerlikler olsa da AH düzeylerini en yüksek oranda sınıflayan SMOTE uygulanmayan Rastgele Orman modeli olduğu bulundu (F1 skoru: 0,86; doğruluk: 0,86 ve AUC: 0,95).Sonuç: Alzheimer hastalığının farklı düzeylerini tahmin etmek için uygun maliyetli ve yaygın kullanılan invaziv olmayan belirteçlerle erken tedavide riskli şüpheli hastaları belirlemek için NACC veri tabanlı makine öğrenmesi metodolojilerimiz kullanılabilir. Anahtar Kelimeler: Alzheimer Hastalığı, Yapay Zeka, Makine Öğrenmesi, Ulusal Alzheimer Koordinasyon Merkezi Aim: Alzheimer's disease (AD), the most common type of dementia, is an irreversible neurodegenerative disease. Starting treatment in the early stages contributes to the maintenance of daily functioning for a certain period of time. For the diagnosis, clinical findings, imaging methods, laboratory examinations, genetic tests and neuropsychological inventories are used to facilitate the detection of the disease with artificial intelligence models. For this purpose, models were established to determine disease levels with the inventory and measurements used in the diagnosis of AD, logit and different machine learning algorithms, and were evaluated according to performance criteria. The aim of this dissertation is to classify the AD levels of the model results with different scenarios and to suggest them to the literature.Methods: Ordinal Logistics Regression, Random Forest, Gaussian Naive Bayes, XGBoost, LightGBM and Deep Neural Network models were established, with different architectures fine-tuned for multiple comparisons of 4 different sequential levels of AD using demographic, genetic, neurocognitive inventory results of patients in the National Alzheimer's Coordination Center (NACC) database and brain volume/thickness measurements calculated from MRI scanners added to them. In models reserved for training and test datasets, LLE, one of the size reduction methods for MRI measurements, and SMOTE techniques were used to address the problem of the uneven distribution of the number of samples in each class.Results: Although there were similarities between the accuracy rate, F1 score, AUC value, and sensitivity, specificity, and precision performance measures of each class, it was found that the Random Forest model without SMOTE was the highest classification for AD levels (F1 score: 0.86; accuracy: 0.86 and AUC: 0.95).Conclusions: NACC data-based machine learning methodologies can be used to identify suspected patients in early treatment with cost-effective and widely used non-invasive markers to predict different levels of AD.Key words: Alzheimer's Disease, Artificial Intelligence Machine Learning, National Alzheimer's Coordinating Center
Collections