Büyük boyutlu veri sınıflandırmada doğrusal boyut indirgeme yöntemlerinin karşılaştırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Yüksek boyutlu verinin analiz edilmesi ile birçok alanda karşılaşılır. Yüksek boyutlu veri analizinde, işlem yükü ve zaman açısından verinin etkin ve hızlı bir şekilde işlenmesi zor olabilir. Bu zorluğun üstesinden gelebilmek için boyut indirgeme yöntemleri yaygın bir şekilde kullanılmaktadır. Doğrusal boyut indirgeme yöntemleri, işlem yükü ve zaman açısından doğrusal olmayan yöntemlere göre daha iyi sonuç verirler. Bu yüzden yüksek boyutu veri analizinde daha çok tercih edilmektedirler. Bu tez çalışmasında yüz ve rakam veri kümeleri kullanılarak çeşitli sınıflandırma yöntemleri üzerinde popüler doğrusal boyut indirgeme yöntemleri ve performansları incelenmiştir. Bu yöntemler, Temel Bileşen Analizi (TBA), Doğrusal Ayırma Analizi (DAA), Yerellik Koruyan İzdüşüm (YKİ), Komşuluk Koruyan Gömme (KKG), Yerellik Duyarlı Ayırma Analizi (YDAA) ve İzometrik İzdüşümdür (İZİ). Doğrusal boyut indirgeme yöntemleri kullanılarak bir veri kümesinin sınıflandırılmasında doğrulukta bir artma veya azalma olmasının veri kümesinin türüne bağlı olduğu görülmüştür. Bazı boyut indirgeme yöntemlerinin sınıflandırma doğrulukları açısından veri kümelerinin türüne göre öne çıktığı görülmüştür. Hatta veri kümelerinden elde edilen özniteliklere göre bazı yöntemlerin öne çıktığı da görülmüştür. Analysis of high-dimensional data is encountered in a lot of areas. In analysis of high-dimensional data, processing data effectively and fast may be troublesome in terms of time and process load. Dimensionality reduction methods are used commonly to overcome this trouble. Linear dimensionality reduction methods give better results than nonlinear dimensionality reduction methods in terms of time and process load. Therefore, they are prefered more in analysis of high-dimensional data. In this thesis, various popular linear dimensionality reduction methods and their performance were investigated on various classification methods by using face and digit datasets. These methods are Principal Component Analysis (PCA), Linear Discriminant Analysis (LDA), Locality Preserving Projection (LPP), Neighborhood Preserving Embedding (NPE), Locality Sensitive Discriminant Analysis (LSDA) and Isometric Projections(IsoP). In the classification of a dataset by using linear dimensionality reduction methods, it was seen that an increase or a decrease in accuracy depends on the kind of the dataset. And it was seen that some linear dimensionality reduction methods become prominent according to the kind of datasets in terms of classification accuracy. Also, it was seen that some linear dimensionality reduction methods become prominent according to features obtained from datasets.
Collections