Mining complex association rules based on inter-cluster communication
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Veri madenciliği kısa ve yararlı özet bilgi oluşturma amacı ile büyük miktarda yapılandırılmış veya yapılandırılmamış bilgi yığınlarını inceleme süreci olarak anlaşılabilir. Bu destekleyici bilgiler daha sonra işletmelere ve uzmanlara yardım amacıyla kullanılacaktır – örneğin – bilgi odaklı olarak alınan kararlar, gelir artırma ve belki de geleceğin trendleri. Araştırmada, veri kümelerinden bilgi keşfi olarak da bilinen veri madenciliği, büyük miktarda bilgiyi seçerek almak ve özetlemek için kullanılan tüm teknikleri ve prosedürleri tanımlamaktadır hal böyle olunca böylesi bir dönüşüm madenciliği ile karşılaşılan tüm zorlukları ve karmaşıklıkları ele almaktadır. Örneğin, ilişkilendirme kurallarının belirlenmesi (başka bir deyişle değişkenler arasında ki ilişkiyi bulmaya çalışma ve araştırma görevi), kümeleme (benzer niteliklere sahip olan veri gruplarını belirleme görevi) ve sınıflandırma (yeni keşfedilmemiş örüntüleri araştırma görevi).Bu nedenle bu çalışmanın amacı bakış açıları olarak adlandırılan farklı altuzaylar arasında ki ilişkiyi bulmaktır, bu altuzaylar aynı veri kümesini tanımlar ve onu çok-boyutlu bir uzayda temsil eder. Dolayısıyla biz, sayısal çoklu-bakış açısı modellerine (çoklu-kümeleme gibi) dayanan iki bakış açısından yararlanarak karmaşık ilişkilendirme kurallarını bulmak için, MCARIC denilen yeni bir yaklaşım öneriyoruz. Veri madenciliği anlayışımızı uyguladığımızda geleneksel sembolik metotlar ile karşılaştırıldığında daha az sayıda karmaşık ilişkilendirme kuralının seçip çıkarılmış olduğunun farkına varabiliriz. Gerçekte, sembolik metotlar ilişkilendirme kurallarını bakış açılarından doğrudan seçip çıkartma kapasitesine sahip değildir. Bu çalışma aynı zamanda önerilen yaklaşımın ikili ve ikili--olmayan (binarized and nonbinarized) veri kümeleri üzerinde çalıştığını göstermektedir, ki bu da sembolik metotları kullanarak uygulanamamaktadır. Data mining can be understood as the process of examining large amount of structured or unstructured information for the reason of building small and useful summarized information. That information helps will be used later in helping businesses and experts to make - for example - knowledge driven decisions, increasing revenue, and may be future trends. In research, the term data mining as it widely referred to as knowledge discovery from data, describes all techniques and procedures used to extract and summarize large amount of information and yet addresses all challenges and complexities faced by mining such transformation. For example, building associations rules (the task of looking and searching for relationships between variables), clustering (the task of identifying groups of data with similar properties), and classification (the task of searching for new undiscovered patterns). Therefore, the idea of this study is to find the relationships between different subspaces namely viewpoints, these subspaces describe the same set of data and represent it in multi-dimensional space. Therefore, we propose a novel approach, called MCARIC, for extracting complex association rules from two viewpoints based on numeric multi-viewpoint models (such as multi-clustering). When we implement our mining approach we can note that less number of complex association rules is extracted when compared to conventional symbolic methods. Indeed, symbolic methods are not able to extract association rules directly from viewpoints. This study also shows that the proposed approach works on binarized and non-binarized datasets, which is not feasible using symbolic methods.
Collections