Belge benzerliği sonuçlarının nsga-ıı ile çok amaçlı optimizasyonu
dc.contributor.advisor | Saraçoğlu, Rıdvan | |
dc.contributor.author | Ahmetoğlu, Hüseyin | |
dc.date.accessioned | 2020-12-10T11:16:09Z | |
dc.date.available | 2020-12-10T11:16:09Z | |
dc.date.submitted | 2018 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/257967 | |
dc.description.abstract | Sınıflandırma algoritmalarının başarı performanslarının artırımı, veri madenciliğinin önemli amaçları arasındadır. Bu tez çalışmasında, veri madenciliği sınıflandırma başarısının sezgisel yöntemlerle arttırılması incelenmiştir. Sınıflandırmada kullanılan eğitim veri seti hem benzerlik hesap sonuçları yönünden hem de sınıflandırma yeteneği yönünden optimize edilmiştir. Aynı sınıfta olan vektörlerin benzerlik sonuçlarının maksimize edilmesi, aynı zamanda farklı sınıftaki vektörlerin benzerlik sonuçlarının minimize edilmesi amaçlanmıştır. Bu çelişen iki durum için çok amaçlı sezgisel yöntemlerden olan, Sıralı Seçkin Bastırılamayan Genetik Algoritma (NSGA II) kullanılmıştır. Hatalı sınıflandırma oranlarının, optimizasyonun her iterasyonunda sıfıra daha çok yaklaştırılması hedeflenmiştir.Bu çalışmada veri madenciliğinin tüm aşamalarının sırayla gerçekleştirilmesine özen gösterilmiştir. Ham veriler işlenerek öznitelikler çıkarılmıştır. Boyut azaltma işlemleri için ise Temel Bileşen Analizi (PCA) kullanılmıştır. Veri setleri üzerinde K En Yakın Komşu Algoritması (KNN) kullanılarak yalın haldeki sınıflandırma başarıları ile optimizasyon sonrası sınıflandırma başarıları karşılaştırılmıştır. Optimizasyonun, eğitim veri setinin sınıflandırma yeteneğini arttırdığı görülmüştür. Optimize edilmiş veriler, eğitim kümesi olarak kullanıldığında sınıflandırma başarısında artış gözlemlenmiştir. | |
dc.description.abstract | Increasing performance of classification algorithms is one of the important goals of data mining. In this thesis study, it has been investigated how to increase the data mining classification success with heuristic methods. The training data set used in the classification is optimized in terms of the both similarity calculation results and the classification ability. It is aimed to maximize the similarity results of the vectors in the same class and at the same time to minimize the similarity results of the vectors in different classes. For these two contradictory cases, Non Sorting Genetic Algorithm II (NSGA II), which is a multipurpose heuristic method, is used. It is aimed to approximate the false classification ratios zero in each iteration of the optimization.In this study, care was taken in order to perform all phases of data mining in order. The raw data were processed and attributes were extracted. For size reduction operations, Principal Component Analysis (PCA) is used. Using the K Nearest Neighborhood (KNN) Algorithm on the data sets, the lean classification successes and the post-optimization classification successes are compared. Optimization has been shown to increase the ability to classify training data sets. An increase in classification success was observed when the optimized data were used as a training set. | en_US |
dc.language | Turkish | |
dc.language.iso | tr | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Belge benzerliği sonuçlarının nsga-ıı ile çok amaçlı optimizasyonu | |
dc.title.alternative | Multi-objective optimization of document similarity results with(via) nsga-ii | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Elektrik-Elektronik Mühendisliği Anabilim Dalı | |
dc.identifier.yokid | 10188695 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | VAN YÜZÜNCÜ YIL ÜNİVERSİTESİ | |
dc.identifier.thesisid | 503872 | |
dc.description.pages | 106 | |
dc.publisher.discipline | Diğer |