İstatistiksel öğrenmede doğrusal sınıflandırma teknikleri ve diyabet verisi üzerine bir uygulama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günümüzde kaydedilen teknolojik gelişmelere paralel olarak, veri madenciliği, istatistiksel öğrenme ve makine öğrenme gibi konulara olan ilgi giderek artmaktadır. Özellikle mühendislik ve sağlık bilimleri ile finans ve endüstri gibi alanlarda istatistiksel öğrenme önemli bir rol oynamaktadır. Bu çalışmada, öncelikle istatistiksel öğrenme teorisine ilişkin genel bilgiler verilmiş, ardından istatistiksel sınıflandırma analizlerinden olan diskriminant analizi ve lojistik regresyon analizine ait teorik bilgiler ayrıntılı olarak incelenmiştir. Bu yöntemler kullanılarak elde edilen modellerin sınıflandırma sonuçlarını karşılaştırmak amaçlanmıştır. Kurulan bu modeller yardımıyla, bağımsız değişkenlerde meydana gelen değişimlerin yanıt değişkenini nasıl etkilediğine ilişkin yorum yapılabilmektedir. Çalışmanın amacı doğrultusunda gerçekleştirilen uygulamada, 21-81 yaş aralığındaki 768 adet Pima Yerlisi kadın bireye ait veriler kullanılmıştır. Bu veriler için kurulan diskriminant analizi ve lojistik regresyon analizi modellerinin sınıflandırma başarıları değerlendirilmiş ve elde edilen sonuçlar yorumlanmıştır.Anahtar Sözcükler: İstatistiksel öğrenme, Diskriminant analizi, Lojistik regresyon analizi, Sınıflandırma In parallel with current technological developments, interest in topics such as data mining, statistical learning and machine learning is gradually increasing. Statistical learning plays an important role particularly in areas such as engineering and health sciences with finance and industry. In this study, firstly general information about statistical learning theory is given and then the theoretical information about discriminant analysis and logistic regression analysis which are the statistical classification methods are examined in detail. It is aimed to compare the classification results of the models obtained using these methods. It can be interpreted how the changes in the independent variables affect the response variable by means of these models. Data set of 768 Pima Native female individuals aged 21-81 years are used in the application which is performed for the purpose of the study. The classification successes of the models for discriminant and logistic regression analysis, which are set up for this data set, are evaluated and the results are interpreted.Keywords: Statistical learning, Discriminant analysis, Logistic regression analysis, Classification
Collections