Mining association rules from clustering models
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İlişkilendirme yöntemleri, büyük veri tabanlarındaki değişkenler (ögeler) arasındaki ilişkileri keşfetmek için kullanılır. Bu ilişkiler, büyük veri tabanında saklıdır. Sembolik modeller, ilişkilendirme yöntemlerini ortaya çıkarma hususunda en çok karşılaşılan modellerdir. Maalesef, bu modeller, çok ciddi sınırlamalara maruz kalmıştır. İlişkilendirme yöntemi oluşturmak, büyük miktardaki fazla olan yöntemler de dâhil olmak üzere, devasa sayıda yöntem oluşturmak için uzun bir zaman alan bir süreçtir. Bu problem, yüksek boyutsal tanım alanı ile uğraşılırken, bariz bir şekilde gözükür. Bu problemlerle başa çıkabilmek için, daha önce kullanılmamış bir yaklaşım oluşturulmuştur. Bu yaklaşım, sayısal ve sembolik modeller arasında ilginç bağlantılar kurarak, sayısal ilişkilendirme yöntemlerini ortaya çıkarmak için önerilmektedir. Sayısal modeller, sadece veriler arasındaki önemli ilişkileri muhafaza eder, bu nedenle bu en potansiyelli ve önemli ilişkilendirme yöntemlerini ortaya çıkartabilir. Bu sayısal yaklaşım, sadece yöntemin her parçasında bir öge olmak üzere, her yöntemin iki ögeye de sahip olduğu anlamına gelen, temel ilişkilendirme yöntemlerini ortaya çıkartabilir.Bundan dolayı, bu tezin amacı, sadece iki ögeyerine, farklı büyüklüklerdeki öge dizileri arasındaki ilişkileri keşfetmek maksadıyla,kompleks ve önemli ilişkilendirme yöntemlerini ortaya çıkartabilecek bu yaklaşımı geliştirmektir. Bu yaklaşım, sayısal metotların önemli ilişkilendirme yöntemlerini ortaya çıkarma olasılığını artırır. Çoklu topografik sinir ağır modeli, bu tezdeki ana modeli göz önünde tutar. Bu modelin en güçlü özelliklerinden birisi, sadece bir veri tabanından ilişkilendirme yönteminin oluşturulmasına izin veren genelleme mekanizmasıdır. Bu birleşme yöntemlerinin çıkarılmasının ta kendisi, sayısal bir sınıflandırma modelinin, doğal-sembolik bir sınıflandırıcı olarak hangi ölçüde hareket edeceğini değerlendiren nitelik ölçümlerine dayanır. Association rules used to discover the interested relationships between variables (items) in large database. These relationships have been hidden in large database. Symbolic models consider the most common to extract association rules. Unfortunately, these models suffered of very serious limitations. Association rule generation is a process that take long time to generate a huge number of rules, including large amount of redundant rules. This problem appears obviously specially when dealing with high dimensional description space. To cope with these problems unsupervised approach has been made. This approach has been proposed to extract numerical association rules by establishing interesting links between numerical and symbolic models. Numerical models keep only the important relations between data, so it can extract the most potential and important association rules. This numerical approach can extract only simple association rules that mean each rule has two items, one item in each part of the rule. So it generates a lot of simple rules. Therefore, the aim of this thesis is to develop this approach to be able to extract complex and important association rules in order to discover relationships between itemsets of different sizes instead of only two items. This approach increases the possibility of numeric methods to extract important association rules. Neural network model with multiple topographic considers the main model in this thesis. One of the strongest features from this model is generalization mechanism that allows association rule extraction from only one database to be performed. The extraction of association rules is itself based on quality measures which evaluate to what extent a numerical classification model behaves as a natural symbolic classifier.
Collections