Veri madenciliğinde apriori temelli ilişkilendirme kuralı algoritmalarının uygulama ve karşılaştırması

Koyuncu, Filiz

View/Open

File_172243 (10.47Mb)

Date

2004

Author

Koyuncu, Filiz

Metadata

Show full item record

Abstract

ÖZET Bilişim uygulamalarının yaygınlaşması ile, bilgisayarlarda büyük miktarlarda veri depolanmasına başlanmıştır. Günümüz veri tabam sistemleri, kullanıcıya depolanan bütün bilgilere kolayca ulaşabileceği araçları ve fonksiyonları sunmamaktadır. Büyük veri tabanlarında saklı olan bu bilgilere ulaşmak ve bu bilgileri kullanmak üzere, otomatik bilgi keşfetmeye yarayan teknikler geliştirilmektedir. Bu tekniklerden biri olan ilişkisel kurallar bulma, depolanan verilerden, ilginç ve sıklıkla rastlanan şemaları tanıma işlevinin, yani veri araştırmasının çok önemli bir dalıdır. İlişkisel kurallar, nesnelerin bir arada olma durumlarını belirlemeyi amaçlar ve bir çok alanda geniş kullanılabilirliğe sahiptir. İlişkisel kurallar bulma, yoğun nesne kümelerinin (verilerde sıkça bir arada görülen nesnelerin) hesaplanması esasına dayanır ve büyük veri tabanlarında hesaplanması oldukça pahalı bir işlemdir. Bu nedenle, daha önce belirlenmiş ilişkisel kuralların korunması oldukça önemli bir konudur. Bu çalışmada, ilişkisel kural üreten temel algoritmalardan biri olan Apriori ve onun türleri olan AprioriTid, AprioriHybrid ve DHP algoritmaları incelenmiş ve C dilinde bu algoritmaların programlan yazılmıştır. Algoritmalar performanslarına, yöntem farklılıklarına, kural üretmeye başladıkları minimum eşik değerlerine göre farklı veri kümeleri üzerinde karşılaştırılmıştır. Son olarak da tüm algoritmaların ortak olarak kullandıkları bir ilişkisel kural üretme prosedürü yazılmış ve üretilen kurallar bir dosya ortamında saklanmıştır. Anahtar kelimeler: Veri Madenciliği, İlişkisel kural madenciliği, Apriori, Apriorid, AprioriHyTid, DHP, algoritma. xııı

ABSTRACT By improvement of data processing methods, a large amount of data is stored in computers.Today's database systems offer a lot of devices and tools to people to get data simply.Automatic information discovery methods are improved to get and use information that is stored in large databases.One of these methods is association rule discovery that is important to find interesting and frequent patterns in data.Association rules purpose counting of objects that get together frequently in data. So it has a large usability at a large of area. Association rule discovery is based on counting of dense object sets and that counting is very expensive in large databases.So it is important to protect rules that are found at first. In this study, Apriori that is one of the main algorithms of associaiton rule mining and its variations that are AprioriTid and AprioriHybrid, and DHP that is based on Apriori are researched and these algorithms are programmed in C language.Algorithms are compared with their run time performance, methods and minimum support tresholds on different data sets.At last, an association rule procedure is used as common by all algorithms and rules that are produced are stored in a file format. Keywords: Data Mining, Associaiton Rule Mining, Apriori, AprioriTid, AprioriHybrid, DHP, algorithm. XIV

URI

https://acikbilim.yok.gov.tr/handle/20.500.12812/691800

Collections

TEZLER

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/embargoedAccess