Birliktelik analizinde özgün bir birleşik ilginçlik ölçümü
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Birliktelik analizi, veri madenciliğinde kullanılan tanımlayıcı modellerden biridir. Bu analizin amacı, veri kümesinde birlikte görülen nesneleri belirleyerek, karar vermeye yardımcı olacak ilginç örüntüleri ortaya çıkartmaktır. Bu örüntülerin ilginçlik düzeyleri bazı ölçümlere göre değerlendirilir ve bu değerlendirme sonucunda ilginç olmayan örüntüler elenir. Literatürde bu ölçümler iki gruba ayrılır. Birincisi, yalnızca örüntünün yapısı ve veriye bağlı olan ?nesnel ilginçlik ölçümleri?; ikincisi de, örüntü yapısı, veri ve aynı zamanda uzman bilgisine bağlı olan ?öznel ilginçlik ölçümleri? dir. Öznel ilginçlik ölçümleri, inanç sistemlerinden yararlanılarak tanımlanır. Bayesci ağlar da inanç sistemleri olduğundan bu ölçümlerin tanımlanmasında kullanılabilir. Nesnel ve öznel ilginçlik ölçümleri, ilginç örüntüleri belirlemede her zaman yeterli olmayabilir. Bu nedenle her iki ölçümü bir araya getiren birleşik bir ölçüm tanımlanmalıdır.Bu çalışmada, birliktelik analizinde ilginç örüntüleri belirlemede, Bayesci ağlar üzerinden tanımlanan öznel ilginçlik ölçümleri ile nesnel ilginçlik ölçümlerinin bir arada kullanıldığı birleşik bir ölçüm önerilmiştir. Tez kapsamında, ilk olarak birliktelik analizi ve Bayesci ağlar ayrıntılı bir şekilde ele alınmış, daha sonra nesnel ve öznel ilginçlik ölçümleri sunulmuştur. Son olarak, önerilen birleşik ölçüm tanıtılmış ve hesaplama algoritmaları verilmiştir. Uygulama bölümünde ise literatürde benzer çalışmalarda kullanılan bir veri kümesi ile ?Türkiye Nüfus ve Sağlık Araştırması ? 2008? sonuçları üzerinden çözümlemeler gerçekleştirilmiş ve önerilen birleşik ilginçlik ölçümünün güçlü yönleri ortaya konulmuştur. Association analysis is one of the descriptive models used in data mining. The objective of this analysis is to determine interesting patterns that help decision making by investigating the items that are seen together in the data. The interestingness levels of these patterns are evaluated according to some measures and the patterns which are not interesting must be eliminated as the result of this evaluation. These measures are mainly seperated into two groups. The first group is ?objective interestingness measures? which depend only on the structure of the pattern and the data. The second one is ?subjective interestingness measures? which depend on expert opinion as well as the structure of the pattern and the data. Subjective interestingness measures are defined over belief systems. Since Bayesian networks are belief systems, these measures can be defined over them. Objective and subjective interestingness measures are not always sufficient to determine interesting patterns. Therefore a combined measure must be obtained.In this study, a combined measure that integrates objective and subjective interestingness measures defined over Bayesian networks is proposed to determine interesting patterns in association analysis. Within the scope of this study, firstly, association analysis and Bayesian networks are explained in detail. Then, objective and subjective measures are presented. Lastly, the proposed combined measure is introduced and related algorithms are given. In application chapter, implementations are carried out over two datasets, the first of which was used similar studies in literature and the second of which contains ?TNSA - 2008? results. Then, the strength of the proposed combined interestingness measure is exhibited over the results.
Collections