Comparison of dimensionality reduction techniques applied to driving event dataset
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Veri madenciliği veya makina öğrenmesi gibi veri inceleme yöntemleriyle kesin çözüm getirilemeyen belirsiz alanlarda çalışmalar yapılırken, veri özelliklerinin sınıflandırma üzerindeki etkileri genellikle bilinmez. Özellikler arasındaki bağımlılık, özelliğin sıfır veya düşük varyansa sahip olması, özelliğin üzerindeki aykırı uç veya kayıp veriler yüzünden sınıflandırma başarıları düşebilir. Sınıflandırma başarısını arttırmak ve sağlıklı sınıflandırma için, özellik boyut indirgemesi için, öznitelik arama veya özellik alt küme seçimi yöntemleri kullanılmaktadır.Özellik alt küme seçimi ve boyut indirgemesi, özellik uzayındaki özellik kümesini indirgemek için kullanılan iki farklı yöntemdir. Özellik alt küme seçiminde, daha etkin öznitelikler bulunurken, boyut indirgemesinde orjinal özellik kümesinden lineer veya lineer olmayan kombinasyonlar yardımıyla yeni öznitelikler üretilir. İki yöntemde sınıflandırma, gruplama ve regresyon problemlerini incelemede kullanılmaktadır. Boyut türetme yöntemi, hali hazırdaki özelliklerden yeni öznitelikler oluşturarak problemin tanımlanabilirliğinden fedakarlık gösterir. Özellik alt küme seçimi yöntemi ise, en iyi özellik kümesi seçmek için, daha az önemli özellikleri eleme yöntemini seçer. Bu yöntemler istenen sınıflandırma başarısı için yeterli değilse, sınıflandırma başarısını arttırmak için veya veri uzayında sınıflandırma için önemli parametreleri bulup onları daha fazla anlamlandırmak için kullanılmalıdır. When investigating on problematical and indefinite areas with data exploring tools such as machine learning or DM algorithms, weight of data attributes effecting classification result is generally unknown issue. Using entire feature set might cause the low classification success. Dependency existance among features, (near) zero variance features, outlier and missing data on feature may harm classification accuracy. To increase classification success and learn feature effect on classification, dimension reduction techniques such as feature subset selection and feature extraction are used.Feature subset selection and feature extraction are the two different applied methods for reducing the dimension set. While feature subset selection methods is focusing to find the most important features that affect the classification result, feature extraction methods are dealing with the creating of new attributes as a linear or non linear combination of initial feature set. Both methods are used on the investigation of classification, clustering and regression problems. Feature extraction methods sacrifice the explanation of the problems, when they combine the existent features to create new ones. On the other hand, features subset selection methods help to pick the most important features by ordering attributes according to their ranking methods. If classification researches are not satisfying or contribution of the attributes that affecting the classification is not known deeply, both methods can be used to understanding the importance of the attributes, and increase classification accuracy.
Collections