Veri madenciliğinde çeşitli kümeleme algoritmalarının farklı platformlarda karşılaştırmalı analizi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Veri üretme, veri toplama ve veri kullanımındaki teknolojik gelişmeler sonucu hızlı bir şekilde artan veritabanı boyutları, verileri kısa süre içinde kullanışlı ve anlaşılır bilgilere çevirebilen yeni teknikler ve araçlar gerektirmektedir. Bu gereksinimlere yanıt vermek üzere tanımlanan veri madenciliği, mevcut veri kaynaklarından, kullanıcının farklı sorularına yanıt verecek, kesin, faydalı, anlaşılır, önceden bilinmeyen ve kullanışlı bilgilerin elde edilmesi işlemidir. Veri madenciliğinde yaygın olarak kullanılan yöntemlerden biri kümeleme analizidir.Kümeleme işlemi veri analizi aşamasında örüntü oluşturma aşamasında, veri kaynağındaki tüm verileri kullanmak yerine, benzer özellik gösteren verileri temsil eden kümeleri kullanır. Veri madenciliğinde bir çok kümeleme metodu bulunmaktadır. Bu çalışmada öncelikle veri madenciliği kavramı açıklanarak veri madenciliğinin aşamaları ve kullanım alanları hakkında bilgiler verilmiş ve daha sonra veri madenciliğinde kullanılan kümeleme algoritmaları teorik ve uygulama çerçevelerinde açıklanmaya çalışılmıştır. XLSTAT, R, WEKA ve RapidMiner (YALE) platformları çeşitli kümeleme algoritmalarını çalıştırmak için kullanılmıştır. Literatürde kullanılan kümeleme işlemine uygun bazı veri kümeleri ve bir üniversitenin kütüphane kayıtlarından elde edilen veriler ele alınarak, kümeleme analizi teknikleri uygulanmış ve sonuçlar analiz edilmiştir. Data generation, data collection and rapidly increasing database sizes as a result of technological developments in use of data requires new techniques and tolls that are capable of transforming data into useful understandable information in a short time. One of the commonly-used methods is the clustering analysis in data mining.In the data analysis phase, clustering process employs clusters that represent similar data rather than using the whole data source.In this study, we first explain the data mining concept. Following this, stages and usage areas of data mining are elaborated. Finally, clustering algorithms employed in data mining are analysed both in theoretical and experimental frameworks. XLSTAT, R, WEKA and RapidMiner (YALE) platforms are used to run several clustering algorithms.The data used several clustering data existing in the literature and also data collected from the library records of a university are used as input for several clustering techniques and the results are analysed.
Collections