Show simple item record

dc.contributor.advisorTaş, Engin
dc.contributor.authorFidan, Üzeyir
dc.date.accessioned2020-12-02T09:27:18Z
dc.date.available2020-12-02T09:27:18Z
dc.date.submitted2013
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/24351
dc.description.abstractBu tezde, çevrimiçi Destek Vektör Makineleri (DVM) kullanılarak doküman sınıflandırma çalışması yapılmıştır. Lasvm algoritması eşli çekirdek yöntemi ile çalışacak şekilde adapte edilmiştir. İlk olarak, seçilen çekirdek fonksiyonun etkileri ve parametreler belirlenmiştir. Bunun için doğrusal bir karar sınırı ile sınıflanacak dokümanlar yüksek boyutlu bir uzaya gömülmüştür. Bu nedenle veri gömme prosedürü ve çekirdek hilesi detayları örneklerle açıklanmıştır. Optimal hiper parametreler belirlendikten sonra eşli eğitim ve test verilerinin farklı kombinasyonları ile deneyler yapılmıştır. DVM modellerinin performansları doğru sınıflandırma oranı ve ROC eğrisi altında kalan alan kriterleri ile değerlendirilmiştir. Sonuçlar, çevrimiçi sınıflandırmanın ikili ve çok sınıflı, sınıflandırma işlemlerine iyi bir alternatif metot olduğunu göstermiştir. Bu doküman sınıflandırma işleminde, eldeki verilerin yüksek boyutlu olması nedeniyle doğrusal eşli çekirdekler, gauss eşli çekirdeklerine göre daha iyi sonuçlar vermiştir.
dc.description.abstractIn this thesis, document classification task is studied using an online Support Vector Machine. Lasvm algorithm is adapted as to work with pairwise kernels. At first, the effects of the choice of the kernel function and its parameters are considered. In order to classify documents with a linear decision bound, the data is mapped into a higher dimensional space. Therefore the data mapping procedure and the kernel trick are explained in detail with several examples. After the determination of optimal hyperparameters, experiments are conducted on different combinations of pairwise training and testing data. Performances of the SVM models are compared according to the classification accuracy and area under the ROC curve. Results indicate that online pairwise classification is a good alternative to the methods used in binary and multiclass classification tasks. In this document classification task, linear pairwise kernels achieve better results than the gaussian pairwise kernels because of the high dimensionality of the data at hand.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectİstatistiktr_TR
dc.subjectStatisticsen_US
dc.titleDestek vektör makineleri ile doküman sınıflandırma
dc.title.alternativeDocument classification with support vector machine
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentİstatistik Anabilim Dalı
dc.subject.ytmSupport vector machines
dc.subject.ytmDocument management
dc.identifier.yokid10009545
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityAFYON KOCATEPE ÜNİVERSİTESİ
dc.identifier.thesisid293207


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess