Analysis of the impact of clustering on Apriori data mining algorithm
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Son yıllarda, mobil iletişim, akıllı telefonlar ve tabletler yaygınlaşmalarını gitgide arttırdılar. Birkaç sene öncesine kadar Iphone veya Android cihazları ve bu cihazların uygulamalarına yabancıydık. Mobil tüketici raporuna göre, 2012 yılında Android ve iOS başta olmak üzere, akıllı telefonların popülerliği büyük artış gösterdi. 2010?da toplam geliri yaklaşık ?174 milyar olan mobil iletişim sektörünün, tıp sektöründen daha geniş bir pazara sahip olduğu açıklandı. Hatta, Avrupada uzay bilimleri sektörü ile kıyaslanabilir seviye gelerek anahtar sektör haline gelmiştir. 2011 yılında mobil servisler nüfusun tamamına ulaşacak şekilde gelişmiştir. Avrupa?da, 2011 yılında mobil servis kullanımı bir önceki yıla göre %128 oranında artmıştır (Japonyada %100 ve Amerika Birleşik Devletlerinde %104). Bu verilere göre Avrupa?nın yaklaşık 456 milyon nüfusunun 656 milyon aboneliği bulunmaktadır. İstatistikler gösteriyor ki, 2012 yılında mobil abone sayısı 741 milyar bireye yükselmiştir. Bu mobil abone sayısı mobil servis endüstrisini, özellikle de uygulama endüstrisini doğrudan etkilemektedir. Akıllı telefon uygulama pazarındaki hızlı büyüme insanların uygulamalara ulaşım ve uygulama tüketim şeklini değiştirmiştir. Bu değişiklik uygulama pazarları için uygulama geliştirenleri ve telefon üreticilerini de etkileyerek, rekabet dinamikleri üzerinde de değişiklikler yaratmıştır. Gartner araştırma firmasına göre, ücretsiz indirilen uygulamalar 2012 toplam indirilen uygulamaların %89unu oluşturmaktadır. Konuyla ilgili bir rapora göre, akıllı telefon kullanıcıları Internette harcadıkları zamandan daha çok süreyi mobil uygulamalarla geçirmektedir. Haziran 2012de yapılan bu inceleme, akıllı telefon ve tablet kullanıcılarının günlerinin önemli bir kısmını uygulama kullanarak (özellikle oyun ve sosyal medya uygulamalarını) geçirdiklerini göstermektedir. Bunun sonucunda, ABI araştırmalarına göre, 2016?da toplam global mobil uygulama gelirinin $46 milyara ulaşması beklenmektedir. Bu kapsamda, tüketicinin akıllı telefona eğilimi ve dolayısıyla mobil işletim sistemi pazarı gittikçe önemli bir hale gelmektedir. Mobil işletim sistemi ve uygulamaları pazarı tamamen ticaret üzerine kurulu olduğu için, müşteri segmentasyonu hem tüketici memnuniyetini sağlamak, hem de servis sağlama profillerini arttırmak için önemlidir. Birçok organizasyon kendi müşterileri, potansiyel müşteriler, üreticiler ve iş ortakları hakkında zengin bir veri tabanına sahiptir, fakat bu veri içinde saklı duran değerli bilgilere erişemezler. Veri madenciliği araçları, şirketleri geniş veriler içinde gizli bilgilerin keşfedilmesi konusunda yönlendirir. Bu çalışmada, tüketicilerin mobil işletim sistemi tercihleri, veri madenciliği tabanlı bir sistem kullanılarak araştırılmıştır. Mobil işletim sistemi kullanımı ile ilgili olarak bir anket hazırlanmış ve toplam 209 kişiye yaptırılmıştır. Amaç bu veri topluluğu içinden, birliktelik kurallarını bulmak olmuştur. Tezin ilk kısmı, veri madenciliği ve veri madenciliğinde kullanılan kümeleme analizi yöntemleri hakkında teorik bilgiler içermektedir. Başlıca üç farklı algoritma sınıfından seçilen algoritmalar karşılaştırılmıştır. İlk algoritma sınıfı olan model tabanlı algoritmalar arasından Expected Maximization (EM) seçilmiştir. 2. algoritma sınıfı olan hiyerarşik kümeleme algoritmaları içinden yukarıdan aşağı ve aşağıdan yukarı yaklaşımları ve 3. sınıf olan bölümleyici kümeleme algoritmaları arasından ise K-means algoritması ayrıntılı ve karşılaştırmalı olarak incelenmiştir. Algoritmalar, WEKA adlı veri madenciliği aracı üzerinde çalıştırılmıştır. Veri madenciliğinde çok kullanılan yöntemlerden biri olan Apriori algoritmasının sonuçlarının iyileştirilebilmesi yönünde araştırmalar yapılmıştır. İyileştirme yöntemlerinden biri olan kümeleme üzerinde durulmuş ve halihazırda akademik yazında bulunan başlıca algoritmalar, tüketicilerden elde edilen veriler üzerinde çalıştırılıp performansları gözlenmiştir. Kümeleme işlemi veri analizinden örüntü oluşturma aşamasında, veri kaynağındaki tüm verileri kullanmak yerine, benzer özellik gösteren verileri temsil eden kümeleri kullanır. Farklı algoritma uygulamaları sonuçlarına göre, Apriori algoritmasından önce, verilere herhangi bir kümeleme algoritmasının uygulanmasının, sonuçların değerlerini arttırdığı görülmüştür. En iyi sonuçların K-Means ve hiyerarşi esaslı algoritmalar ile elde edildiği görülmüştür. K-means algoritmasının zayıf noktası olan, ilk merkezî nokta belirleme işlemi, hiyerarşik algoritmadan elde edilen ilk noktalar kullanılarak bertaraf edilmiştir. Önerilen bu yeni yaklaşımın, bu vakaya ait güven değerlerini K-means algoritmasına göre %70, destek değerlerini ise %60 oranında daha yüksek verdiği gözlemlenmiştir. Mobile computing and communication devices are widely utilized by users from different occupations and their usage is steadily increasing. Mobile communication characterizes our current information era. This rapid diffusion has had a direct effect on the applications proposed for smart devices in recent years. Many organizations collect and store data about their customers, suppliers and business partners. However, much of the useful marketing insights are hidden in that enormous amount of data. Data mining is the process of searching and analyzing data in order to find potentially useful information. In this study, as a preliminary approach, we have proposed an ontology-based methodology. Although data mining consists of a broad family of computational methods and algorithms, for this study, we have chosen the Apriori algorithm in order to determine association rules. Next, we have aimed at examining the effectiveness of different clustering algorithms when determining the association rules. Hence, we have compared the results of five different approaches. Three clustering algorithms are used: K-means, Expectation Maximization and Hierarchical Clustering. Most predictive association rules with best values are obtained by `K-means? and `Hierarchy-based? data mining methodologies. Therefore, we have proposed a new algorithm that combines these two algorithms and we have called it the `Hierarchical K-Means algorithm.The data analysis framework is applied to the data of mobile operating systems? users. By extracting most important information from consumer data, we claim that this framework may direct providers/application developers offer the right product/ advertisement to the right consumer.
Collections