Veri madenciliği süreci ve gerçek bir veri seti üzerinde uygulanması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Veri tabanı büyüklüklerinin terabaytlarla ifade edildiği günümüzde verinin anlamlı bir şekilde ilişkilendirilebilmesi ve ?değerli veri?nin bu veritabanından çıkarılabilmesi için yeni yöntemlere ihtiyaç duyulmuş ve veri madenciliği kavramı ve süreci bu ihtiyaç sonunda ortaya çıkmıştır.Bu tez çalışmasında veri madenciliği sürecinin tarihçesi, OLAP ve istatistik gibi disiplinlerle ilişkisi açıklanmış olup süreç örneklerle detaylı olarak ele alınmış ve veri madenciliği yöntemleri ayrıntılı olarak incelenmiştir.Veri madenciliği yöntemleri sınıflandırma, kümeleme ve birliktelik kuralları ana başlıkları altında ele alınmış, karar ağacına ait ID3, C4.5, CART, k-en yakın komşuluk algoritmaları ve market sepet analizi örneklerle incelenmiştir.Uygulama bölümünde gerçek bir veri seti üzerinde Clementine programı kullanılarak veri madenciliği uygulaması yapılmış ve sonuçları yorumlanmıştır. Database size are expressed with terabytes today. In order to draw meaningful conclusions about the data which is ?valuable?, new techniques and methods are required and data mining process appeared for this necessity.In this thesis, history of data mining process, its relations with the disciplines such as OLAP and statistics are dealed with and data mining techniques are detailed with samples.Classification, desicion trees, clustering, association rules, market basket analyses are studied in detail with the algorithms ID3, C4.5, CART, k-NN (k nearest neighbour).In the last section, data mining application has been made on a real sample data set by using Clementine software.
Collections