Veri madenciliği modelleri ve örnek bir uygulama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışma içeriğinde, ham verilerden faydalı bilgi elde etme aşamaları olan veri madenciliği kavramı anlatılmaya çalışılmıştır. Bu ham veriyi işlemede yaygın olarak kullanılan CRISP-DM aşamaları açıklanmıştır. Veri madenciliği algoritmalarının tanımlayıcı ve tahmin edici olarak ikiye ayrılmasından bahsedilmiştir. Ayrıca sınıflandırma, kümeleme ve birliktelik kuralları algoritmalarıyla kurulan modellerin aşmaları ayrıntılı olarak anlatılmıştır. Bu anlatımlar doğrultusunda uygulamada Türkiye'de kitap satışı yapan internet sitelerinden alınan en çok satan kitap listelerindeki kitapları türlerine göre sınıflandırma yaparken hangi faktörlerin etkili olduğu belirlenmeye çalışılmıştır. Çalışmada, veri madenciliği sınıflandırma algoritmalarından biri olan K- En Yakın Komşuluk (k-nearest neighbor, k-nn) algoritması en başarılı sonucu verdiği için seçilmiştir. In this study, data mining concept, which means extracting useful information from raw data, has been elucidated. Besides, CRISP-DM phases, which is commonly used in raw data processing has been explained. Moreover, it has been mentioned that two types of data mining algorithms as descriptive and predictive. In addition, the phases of models built-up by the rules of classification, clustering and association algorithms has been explained in detail.In line with those expressions, it has been determined that which factors affects to classification of the book sale web sites' bestsellers of Turkey according to their types. In this study, one of the data mining classification algorithm, k-nearest neighbor – k-nn algorithm has been selected due to its best result.
Collections