Yapay sinir ağları, lojistik regresyon ve destek vektör makinesi istatistik yöntemlerinin sınıflandırmadaki karşılaştırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Yapay Sinir Ağları, Destek Vektör Makineleri ve Lojistik Regresyon yöntemleri parametrik olmayan test yöntemleridir. Sonuç değişkeninin ikili olduğu veri setlerinde sınıflayıcı olarak kullanılır. Yapay sinir ağları insan beyninin çalışma prensibinden yola çıkılarak oluşturulmuştur. Ağ yapısı içinde yer alan sinir düğümleri giriş verilerinin istatistiksel bir takım fonksiyonlar ve eşik değerler ile işlendiği ve çıktıya dönüştüğü esas işlem merkezleridir. Geri Beslemeli Yapay Sinir Ağları algoritmasındaki döngüler her verinin birçok tekrarla düğümden geçmesini ve işlenmesini sağlayarak ağın hata değerlerini küçültür ve kendini eğiterek daha doğru sonuçlar vermesini sağlar. Yapay Sinir Ağları yöntemi çıktı değerlerini sürekli güncellediği için bilgisayar hafızasında daha az yer kaplar. Tekrarlı ölçümlenen veri yığınlarının analizinde başarılı sonuçlar veren iyi bir sınıflayıcı algoritmadır. Destek Vektör Makineleri klasik doğrusal veri ayrıştırma yönteminden farklı olarak sarmal ayrıştırıcı özelliğe sahip bir sınıflayıcıdır. Yine klasik ayrıştırıcılardan farklı olarak üç boyutlu verilere ait değerleri bir uzay düzlemi yaratarak sınıflama yeteneği gösterir. Lojistik Regresyon Yöntemi bir olayın gerçekleşmesine katkıda bulunan değişkenleri saptar ve bunların modele kattığı olasılık değerini hesaplar. Kernel fonksiyonlar yönteme denek bazında olasılık hesaplama yeteneği kazandırır. Bu olasılık değerlerinin toplamı eşik değer gibi sınıfların sınır değerlerini belirler. Sonuç olarak söz konusu verinin gerçekleşme ihtimali o verinin 'Var' ya da 'Yok' sınıfına atanmasını sağlar. Beklenen sonuç ve mevcut sonucun tutarlılığı veri setinin doğru sınıflama değerini yansıtır. Lojistik Regresyon yöntemi kolay açıklanabilir ve risk hesapladığı için sağlık verilerinin analizinde avantajlı bir yöntemdir. Yapay Sinir Ağları, Destek Vektör Makineleri ve Lojistik Regresyon yöntemlerinin sınıflama başarıları WEKA (Waikato Environment for Knowledge Analysis) paket programı ile karşılaştırıldı. Artificial Neural Networks, Support Vector Machines and Logisitic Regression methods are nonparametric test methods. When the data set have a binary dependent variable they are used for classification. Artificial Neural Network is modelling from the behavior of human brain. The hidden node in the network is the main prosessing center which uses some statistical functions and treshold values to convert the input variable to the output variable. The cyclic structure of Back Propagation Neural Network provides to prosses to take the input variable again and again in to the nodes to minimize the errors and provides to network to train itself for best results. Because as The Artificial Neural Network updates the output values continuously, the method takes a small space from the computor memory. In the analysis of continious measured data stacks it is a successful algorithm for classification. Support Vector Machines differ from the clasic linear classification methods by their spiral classification properties. And also SVM differs from clasic classification method by creating a space plane for classification tree dimention data values. The Logistic Regression method identifies the variables which contribute to the event and calculates the propability values of those variables for the current model. Kernel functions give the ability to calculate the probabilities of cases to the method. The sum of this propability values determine the boundary of class as a treshold value. As a result, the posibility of occurence for current data provides the data to be assed to class 'Present' or to class 'Absent'. The consistency of expected and current results of data set shows the correct classification rate. Being easy to explain the statistical results and calculating odds make Logistic Regression the favored method in analising the healty datas. The achievement classification of Artificial Neural Network, Support Vector Machines and Logistic Regression Methods have been compared by WEKA (Waikato Environment for Knowledge Analysis) package program.
Collections