Veritabanları üzerinde veri madenciliği uygulaması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
IV VERİTABANLARI ÜZERİNDE VERİ MADENCİLİĞİ UYGULAMASI (Yüksek Lisans Tezi) Hüseyin GÜRÜLER MUĞLA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ 2005 ÖZET Bu tezin amacı, Muğla Üniversitesi öğrencilerinin eğitimdeki basan profilini ortaya çıkaran, bilgi tabanlı bir sistemin geliştirilmesi ve ham veri şeklindeki mevcut öğrenci kayıtlarının, üniversite öğrencilerini tanımada fayda sağlayacak bilgilere dönüştürmektir. Veri madenciliği, büyük miktarda veri içerisinden anlamlı ve yararlı bağıntı ve kuralların bilgisayar programları kullanarak aranması ve analizidir. Veritabanlarında bilgi keşfi ise ham veriden bilgi elde etmeye kadar veri madenciliğini de içine alan geniş bir süreçtir. Çalışmada kullanılan Muğla Üniversitesi öğrenci verileri, Öğrenci İşleri Daire Başkanlığı'nın izni ile alınmıştır. Bilgi keşfi işlemleri, İktisadi ve İdari Bilimler Fakültesi 1995 yılı ve sonrası öğrenci verileri üzerinde gerçekleştirilmiştir. Çalışmada, bilgi keşfi sürecini veritabanı yönetim sistemi ile bütünleştiren bir araç olarak MÜKÜP (Muğla Üniversitesi Öğrenci Bilgi Keşif Ünitesi Programı) geliştirilmiş ve bu öğrenci verileri üzerinde uygulanmıştır. Çalışma iki kısımdan oluşmaktadır. İlk olarak gerçekleştirilen veritabanı sorgulamaları ile üniversite öğrencilerine ait demografik bilgileri içeren bir bilgi dağılımı elde edilmiştir. Aynı zamanda keşif sürecinin veri hazırlama ve model oluşturma bölümlerinde uygun kararlar alabilmek için ihtiyaç duyulan eldeki veriyi tanıma gerçekleştirilmeye çalışılmıştır. İkinci bölümde bilgi keşfi süreci yer almaktadır. Burada öğrencilerin kişisel verileri ile üniversitede elde ettikleri başarı verileribirleştirilerek bir sınıflandırma modeli gerçekleştirilmiştir. Sınıflandırma modeli, üniversite öğrencilerinin eğitimdeki başarılarına hangi kişisel özellikleri en çok etki ettiğini araştırmaktadır. Model oluşturma ve gösteriminde bir veri madenciliği algoritması olan karar ağaçlan kullanılmıştır. Araştırma sonucunda, öğrencilerin üniversiteye kayıt olma türü ve aile gelir düzeylerinin eğitimdeki basanlarında etkili olduğu görülmüştür. Anahtar Kelimeler: Veritabanlarında Bilgi Keşfi, Veri Madenciliği, Sınıflandırma, Karar Ağaçlan Sayfa adedi :124 Tez yöneticisi :Dr. Mehmet KARAHASAN VI DATA MINING APPLICATION ON DATABASES (M. ScThesis) Hüseyin GÜRÜLER MU?LA UNIVERSITY INSTITUTE of SCIENCE and TECHNOLOGY 2005 ABSTRACT The goal of this thesis is to develop a knowledge based system that produces the success profile of the students of Mugla University and to transform student's records that are in form of raw data into information that helps us better understand the students. Data mining is extracting and analyzing meaningful and beneficial rules and relations from a large set of data using computer programs. Knowledge discovery on databases is a process that spans from data mining to extracting information from raw data. In this study, Mugla University student data were used with permission of the Office of Student Affairs. Student data used for knowledge discovery process was chosen from Faculty of Economical and Administrative Sciences that are on and after 1995. In this study, MUKUP (Mugla University Student Knowledge Discovery Unit Program) was developed and applied on the student data. This study has two parts. At first, using database queries, a knowledge distribution has been achieved that consist of student demographic data. At the same time, the student data was investigated which is needed to get appropriate decisions during the data preparation and modeling stages of discovery. Second part consists of knowledge discovery process. Individual records of students and success data of students areVII combined and a classification model is developed classification model investigates which personal characteristics of the students has the most effect on student access. For modeling and representation, a data mining algorithm called decision trees is used. Research results show that registration type and family income of the students affect their educational success. Key Words: Knowledge Discovery on Databases, Data Mining, Classification, Decision Trees Page number : 124 Adviser : Dr. Mehmet KARAHASAN
Collections