Evaluation and validation of the interest of the rules association in data-mining
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İlginç ilişkilendirme kuralları, veriden bilginin çıkarılmasını oluşturan özel bir kısımdır. Apriori'nin destek ve kural temelli algoritmaları, kural madenciliği sorununa zarif bir çözüm getirdi, ancak ilgisiz bazı kurallar seçerek ve kuralları yok sayarak çok fazla ilginç kural üretiyorlar [1] [2]. Diğer Destek ve güven ölçütlerinin değerlendirilmesi gerekir. Bu çalışmada, literatürde önerilen temel ölçütleri inceliyoruz. ve bunları değerlendirmek için kriterler öneriyoruz. Daha sonra, VC-boyut dahil, istatistiksel öğrenme teorisi araçlarını kullanan bir doğrulama yöntemi öneriyoruz. Çok sayıda ölçüm ve aday kuralların çokluğu göz önüne alındığında, bu araçların ilgi alanı, tüm kurallar ve tüm ölçümler için aynı anda tek tip asimptotik olmayan terminallerin kurulmasına izin vermektir. The interesting association rules is a special part of knowledge extraction from data. Apriori's support- and rule-based algo-rithms have provided an elegant solution to the problem of rule mining, but they produce too much rules, selecting some rules of no interest and ignoring rules[1] [2]. interesting. Other measures are needed to complete the support and the confidance. In this paper, we review the main measures proposed in the literature and we propose criteria to evaluate them. We then suggest a validation method that uses the tools of statistical learning theory, including VC -dimension. Given the large number of measurements and the multitude of candidate rules, the interest of these tools is to allow the construction of uniform non-asymptotic terminals for all the rules and all the measurements simultaneously.
Collections