Birliktelik kuralları algoritmalarının otomotiv sektörü verileri üzerinde spmf ve weka ile performans analizi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Veri Madenciliği (VM), herhangi bir veri kümesi üzerinde yer alan mevcut verilerinanaliz edilerek anlamlı çıkarımlarda bulunulabilmesi veya gelecekte oluşabilecek verileriteknik yöntemler ile tahmin etmeyi sağlayan bir bilim dalıdır. Bu tahmin veya çıkarımlaradayalı bilgisayar destekli karar verme mekanizmalarının geliştirilmesine katkıda bulunur.Hızla gelişmekte olan teknoloji ile birlikte toptan ve perakende sektöründe hizmet verenşirketler artık verilerini çok daha hızlı, kolay ve düşük maliyetler ilesaklayabilmektedirler. Şirketlerde gün içerisinde gerçekleştirilen tüm işlemler (satış, carikart, faturalama vb.), gün sonunda birleşerek büyük veri kümelerini oluşturmaktadır. Güngeçtikçe hızlı bir şekilde katlanarak boyutu artan bu veri kümelerinden hem şirketler içinhem de müşteriler için bir takım faydalı çıkarımlar elde etmek mümkündür. Bu aşamadabahsi geçen çıkarımları yapabilmek için veri madenciliğinden faydalanılmaktadır. Buçalışmada Türkiye'nin birçok bölgesine araç bakım ürünleri satmakta olan bir şirkete aitveri kümesine, Veri Madenciliği Pazar Sepet Analizi Birliktelik Kuralı Algoritmalarındanen güncel 11 algoritma uygulanmış ve birlikte satışı yapılan ürünlere ait kurallar tespitedilmiştir. Belirlenen kurallar sayesinde ilgili şirket için, satış ve pazarlama stratejilerininyeniden belirlenmesi, depolama alanlarının verimli bir şekilde revize edilmesi,müşterilere ve bölgelere uygun satış kampanyalarının oluşturulması sağlanabilecektir.Tez çalışmasında öncelikle en çok kullanılan iki algoritma olan Apriori ve FP-Growthalgoritmaları hem WEKA hem de SPMF'de farklı destek değerleri için ayrı ayrıçalıştırılmış ve her iki programın performans değerleri grafiksel olarak kıyaslanmıştır.SPMF'nin WEKA'ya göre daha başarılı olduğu görüldükten sonra işlemlere bu yazılımile devam edilmiş ve ilgili veri kümesi üzerinde 11 güncel birliktelik kuralıalgoritmalarının çalışma zamanı, çalışma esnasında kullandığı toplam bellek, ilgilialgoritmalar için çıkarılan kural sayısı SPMF programında hesaplanmış ve aynı zamandabu çıkarımlar farklı destek değerleri için grafiksel olarak birbirleriyle karşılaştırılmıştır.Sonuç olarak SPMF yazılımında gerçekleştirilen uygulama neticesinde, dEclat_bitsetalgoritması 6 aylık ve 12 aylık veri kümesi için en verimli performansı göstermiştir.Ancak 22 aylık veri kümesinde 0.7 ve 0.3 destek değerleri için Eclat algoritmasının enverimli algoritma olduğu söylenebilir; diğer yandan dEclat_bitset, 22 aylık verikümesinde 0.3 ve 0.1 destek değerleri için en verimli algoritmadır. Data Mining is a branch of science that enables the analysis of existing data on any dataset to make meaningful inferences or to predict future data with technical methods. Thiscontributes to the development of computer-aided decision-making mechanisms based onpredictions or inferences. With the rapidly developing technology, companies serving inthe wholesale and retail sector can now store their data much faster, easier and with lowercosts. All transactions performed during the day (sales, current card, invoicing, etc.) inthe companies combine at the end of the day to form big data sets. It is possible to derivesome useful inferences both for companies and customers from these data sets which arerapidly increasing in size. At this stage, data mining is used to make the inferencesmentioned. In this study, Turkey's many regions of car care products to sell at a company-owned data set, Data Mining Market Basket Analysis Association Rule algorithms latest11 algorithm is applied and the rules of the products made in conjunction sale have beenidentified. Thanks to these rules, it is possible to redefine sales and marketing strategiesfor the related company, to revise the storage areas efficiently, and to create salescampaigns suitable for customers and regions. In this thesis, Apriori and FP-Growthalgorithms, which are the two most commonly used algorithms, were run separately fordifferent support values in both WEKA and SPMF and the performance values of bothprograms were compared graphically. After the SPMF was found to be more successfulthan WEKA, the operations were continued with this software and the working time ofthe 11 current association rules algorithms on the relevant data set, the total memory usedduring the run, the number of rules issued for the relevant algorithms were calculated inthe SPMF program. the inferences were compared graphically for different supportvalues. As a result of the application performed in SPMF software, dEclat_bitsetalgorithm showed the most efficient performance for 6 months and 12 months dataset.However, it can be said that Eclat algorithm is the most efficient algorithm for supportvalues of 0.7 and 0.3 in the 22-month dataset; on the other hand, dEclat_bitset is the mostefficient algorithm for support values of 0.3 and 0.1 in the 22-month dataset.
Collections