An improved organization method for association rules and a basis for comparison of methods
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Büyük veri tabanlarında, keşfedilmiş birliktelik kurallar kümesi genellikle geniştir ve yorumlaması güçtür. Bu birliktelik kurallarını daha anlaşılır bir hale getirmek için bir kaç gruplandırma ve budama yöntemi geliştirilmiştir. bu yöntemlerden bir tanesi, destek ya da güven ölçüleri için düşük alt sınırlar içeren uygulamalarda (örneğin, ürün/süreç kalitesinin iyileştirilmesi için birliktelik analizi) daha etkili ve daha verimli olacak şekilde iyileştirilmiştir. Kıyaslama veri tabanları üzerindeki deney sonuçları, iyileştirilmiş yöntemin daha fazla kuralı gruplandırdığını ve budadığını göstermektedir.Literatürde, kuralları gruplandırma ve budama içeren, çok sayıda kural indirgeme yöntemi önerilmiştir. Bu yöntemlerin fazlalığı, kalite iyileştirme gibi uygulamalar için doğru yöntem seçilmesini güçleştirmektedir. Bu problemin çözümü için yeni bir performans karşılaştırma temeli ortaya konulmuştur. Bu temel kullanılarak, iyileştirilmiş yöntemle orijinal yöntem karşılaştırılmıştır. Geliştirilen bu temel asıl olarak kalite verisi için oluşturulmuştur. Ancak, esnek yapısıyla diğer uygulama alanlarında kullanılmak için değiştirilebilir özelliğe sahiptir. In large data, set of mined association rules are typically large in number and hard to interpret. Some grouping and pruning methods have been developed to make rules more understandable. In this study, one of these methods is modified to be more effective and more efficient in applications including low thresholds for support or confidence, such as association analysis of product/process quality improvement. Results of experiments on benchmark datasets show that the proposed method groups and prunes more rules.In the literature, many rule reduction methods, including grouping and pruning methods, have been proposed for different applications. The variety in methods makes it hard to select the right method for applications such those of quality improvement. In this study a novel performance comparison basis is introduced to address this problem. It is applied here to compare the improved method to the original one. The introduced basis is tailored for quality data, but is flexible and can be changed to be applicable in other application domains.
Collections