Destek vektör makineleri ile doküman sınıflandırma
dc.contributor.advisor | Taş, Engin | |
dc.contributor.author | Fidan, Üzeyir | |
dc.date.accessioned | 2020-12-02T09:27:18Z | |
dc.date.available | 2020-12-02T09:27:18Z | |
dc.date.submitted | 2013 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/24351 | |
dc.description.abstract | Bu tezde, çevrimiçi Destek Vektör Makineleri (DVM) kullanılarak doküman sınıflandırma çalışması yapılmıştır. Lasvm algoritması eşli çekirdek yöntemi ile çalışacak şekilde adapte edilmiştir. İlk olarak, seçilen çekirdek fonksiyonun etkileri ve parametreler belirlenmiştir. Bunun için doğrusal bir karar sınırı ile sınıflanacak dokümanlar yüksek boyutlu bir uzaya gömülmüştür. Bu nedenle veri gömme prosedürü ve çekirdek hilesi detayları örneklerle açıklanmıştır. Optimal hiper parametreler belirlendikten sonra eşli eğitim ve test verilerinin farklı kombinasyonları ile deneyler yapılmıştır. DVM modellerinin performansları doğru sınıflandırma oranı ve ROC eğrisi altında kalan alan kriterleri ile değerlendirilmiştir. Sonuçlar, çevrimiçi sınıflandırmanın ikili ve çok sınıflı, sınıflandırma işlemlerine iyi bir alternatif metot olduğunu göstermiştir. Bu doküman sınıflandırma işleminde, eldeki verilerin yüksek boyutlu olması nedeniyle doğrusal eşli çekirdekler, gauss eşli çekirdeklerine göre daha iyi sonuçlar vermiştir. | |
dc.description.abstract | In this thesis, document classification task is studied using an online Support Vector Machine. Lasvm algorithm is adapted as to work with pairwise kernels. At first, the effects of the choice of the kernel function and its parameters are considered. In order to classify documents with a linear decision bound, the data is mapped into a higher dimensional space. Therefore the data mapping procedure and the kernel trick are explained in detail with several examples. After the determination of optimal hyperparameters, experiments are conducted on different combinations of pairwise training and testing data. Performances of the SVM models are compared according to the classification accuracy and area under the ROC curve. Results indicate that online pairwise classification is a good alternative to the methods used in binary and multiclass classification tasks. In this document classification task, linear pairwise kernels achieve better results than the gaussian pairwise kernels because of the high dimensionality of the data at hand. | en_US |
dc.language | Turkish | |
dc.language.iso | tr | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | İstatistik | tr_TR |
dc.subject | Statistics | en_US |
dc.title | Destek vektör makineleri ile doküman sınıflandırma | |
dc.title.alternative | Document classification with support vector machine | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | İstatistik Anabilim Dalı | |
dc.subject.ytm | Support vector machines | |
dc.subject.ytm | Document management | |
dc.identifier.yokid | 10009545 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | AFYON KOCATEPE ÜNİVERSİTESİ | |
dc.identifier.thesisid | 293207 |