Veri madenciliği ve istatistik
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
VERİ MADENCİLİĞİ VE İSTATİSTİK Burçin Sarıkan Hacettepe Üniversitesi, İstatistik Ana Bilim Dalı ÖZ Bu çalışmada, yapılan her işlemin veri tabanlarına kaydedilmesi sonucu oluşan ham veri yığınlarından, kullanılabilir bilgi elde etmede yararlanılan `Veri Madenciliği` ni açıklamak ve veri madenciliğinde `istatistiğin` yerini vurgulamak amaçlandı. Birinci bölümde konuya giriş yapıldı. Veri madenciliği genel olarak anlatıldı, istatistikle olan benzer ve farklı yanları hakkında bilgi verildi. İkinci bölümde, veri tabanlarında bilgi keşfi, evreleri ile birlikte açıklandı. Bu evrelerden özellikle veri hazırlama ve veri madenciliği üzerinde duruldu. Veri madenciliği algoritmalarının geliştirilmesi ve performanslarının artırılması, verilerde indirgeme, veri madenciliğinin amaçları, veri madenciliği algoritmaları, veri madenciliğinde analitik yöntemler, veri tabanı yöntembilimi, istatistiksel değerler incelendi. Üçüncü bölümde çalışma ile ilgili uygulama geliştirildi. Çalışmada, veri madenciliğine ana hatlarıyla giriş yapıldı ve istatistikle olan ilişkisi anlatıldı. Uygulama da bu çerçeve içerisinde geliştirildi. Veri madenciliğinin önemli tekniklerinden olan Karar Ağacı, Sepet Analizi ve Kümeleme (Cluster) Analizi üzerinde duruldu. Bu teknikleri kullanmakla, elde edilen sonuçların etkinliğinden çok, tekniklerin ne amaçla kullanıldığını göstermek amaçlandı. Uygulamada Oracle9i Release 2 (9.2) Veri Tabanının Veri Madenciliği araçlarından faydalanıldı. Bu araçlar yardımıyla kitle belli parçalara ayrılarak incelendi ve bu incelemelerin sonuçları grafiklerle gösterildi. Anahtar Kelimeler: Veri madenciliği, bilgi keşfi, istatistik Danışman: Yard.Doç.Dr.Ibrahim ZOR, Hacettepe Üniversitesi, İstatistik Bölümü, İstatistik Ana Bilim Dalı DATA MINING AND STATISTICS Burçin Sankan Hacettepe University, Statistics Section ABSTRACT In this study, it is aimed at introducing the phenomena of data mining, which is employed to obtain usable (practical) knowledge from raw data mass developed by recording all the operations performed into database, as well as emphasizing the position of statistics in data mining. The first chapter briefly introduces the theme, where data mining is discussed in general, and its similarities and differences with statistics are identified. In the second chapter, the knowledge discovery in database is explained in conjunction with its stages. Amongst these stages, a particular emphasis is given to data preparation and data mining. More specifically, the following issues are scrutinized: the development of data mining algorithms and improvement of their performances, the reduction in data, the objectives of data mining, the algorithms of data mining, the analytical procedures in data mining, the data mining methodology, and statistical values. The third chapter addresses to the development of an application of the study. Herein, the outlines of data mining are discussed and its relationship with statistics is clarified. The application is developed within this frame accordingly. Decision Tree, Market Basket Analysis and Cluster Analysis, which are known as significant techniques of data mining, are dwelt upon. By using these techniques, it is endeavored to demonstrate reasons underlying why these techniques are used, rather than the effectiveness of results obtained with them. In the application, the data mining tools of Oracle 9i Release 2 (9.2) database are utilized. Taking advantage of these tools, population is examined by dividing it into several parts, and the results of this examination are reflected in the graphs. Keywords: Data mining, knowledge discovery, statisticsAdvisor: Ass.Prof. Ibrahim ZOR, Hacettepe University, Department of Statistics, Statistics Section
Collections