Show simple item record

dc.contributor.advisorSaraçoğlu, Rıdvan
dc.contributor.authorAhmetoğlu, Hüseyin
dc.date.accessioned2020-12-10T11:16:09Z
dc.date.available2020-12-10T11:16:09Z
dc.date.submitted2018
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/257967
dc.description.abstractSınıflandırma algoritmalarının başarı performanslarının artırımı, veri madenciliğinin önemli amaçları arasındadır. Bu tez çalışmasında, veri madenciliği sınıflandırma başarısının sezgisel yöntemlerle arttırılması incelenmiştir. Sınıflandırmada kullanılan eğitim veri seti hem benzerlik hesap sonuçları yönünden hem de sınıflandırma yeteneği yönünden optimize edilmiştir. Aynı sınıfta olan vektörlerin benzerlik sonuçlarının maksimize edilmesi, aynı zamanda farklı sınıftaki vektörlerin benzerlik sonuçlarının minimize edilmesi amaçlanmıştır. Bu çelişen iki durum için çok amaçlı sezgisel yöntemlerden olan, Sıralı Seçkin Bastırılamayan Genetik Algoritma (NSGA II) kullanılmıştır. Hatalı sınıflandırma oranlarının, optimizasyonun her iterasyonunda sıfıra daha çok yaklaştırılması hedeflenmiştir.Bu çalışmada veri madenciliğinin tüm aşamalarının sırayla gerçekleştirilmesine özen gösterilmiştir. Ham veriler işlenerek öznitelikler çıkarılmıştır. Boyut azaltma işlemleri için ise Temel Bileşen Analizi (PCA) kullanılmıştır. Veri setleri üzerinde K En Yakın Komşu Algoritması (KNN) kullanılarak yalın haldeki sınıflandırma başarıları ile optimizasyon sonrası sınıflandırma başarıları karşılaştırılmıştır. Optimizasyonun, eğitim veri setinin sınıflandırma yeteneğini arttırdığı görülmüştür. Optimize edilmiş veriler, eğitim kümesi olarak kullanıldığında sınıflandırma başarısında artış gözlemlenmiştir.
dc.description.abstractIncreasing performance of classification algorithms is one of the important goals of data mining. In this thesis study, it has been investigated how to increase the data mining classification success with heuristic methods. The training data set used in the classification is optimized in terms of the both similarity calculation results and the classification ability. It is aimed to maximize the similarity results of the vectors in the same class and at the same time to minimize the similarity results of the vectors in different classes. For these two contradictory cases, Non Sorting Genetic Algorithm II (NSGA II), which is a multipurpose heuristic method, is used. It is aimed to approximate the false classification ratios zero in each iteration of the optimization.In this study, care was taken in order to perform all phases of data mining in order. The raw data were processed and attributes were extracted. For size reduction operations, Principal Component Analysis (PCA) is used. Using the K Nearest Neighborhood (KNN) Algorithm on the data sets, the lean classification successes and the post-optimization classification successes are compared. Optimization has been shown to increase the ability to classify training data sets. An increase in classification success was observed when the optimized data were used as a training set.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleBelge benzerliği sonuçlarının nsga-ıı ile çok amaçlı optimizasyonu
dc.title.alternativeMulti-objective optimization of document similarity results with(via) nsga-ii
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentElektrik-Elektronik Mühendisliği Anabilim Dalı
dc.identifier.yokid10188695
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityVAN YÜZÜNCÜ YIL ÜNİVERSİTESİ
dc.identifier.thesisid503872
dc.description.pages106
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess