Show simple item record

dc.contributor.advisorPüskülcü, Halis
dc.contributor.authorÖzakar, Belgin
dc.date.accessioned2021-05-08T08:08:14Z
dc.date.available2021-05-08T08:08:14Z
dc.date.submitted2002
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/642876
dc.description.abstractöz Web madenciliği son zamanlarda çok yaygın olarak kullanılan Veri Madenciliği ve World Wide Web'i birleştiren bir araştırma alanıdır. Web madenciliği konusundaki araştırmalar Veritabanı, İstatistik, Yapay Zeka ve Görsellik gibi araştırma ekiplerinin ilgisini çekmektedir. Web madenciliği konusu henüz çok yeni olduğundan bazı kavramlar netlik kazanamamıştır. Ancak kabul gören bir yaklaşım bu konudaki çalışmaları üç ana başlık altında toplar: Web içerik madenciliği, Web yapı madenciliği ve Web kullanım madenciliği. Web içerik madenciliği web içinde bulunan veri ve dokümanlardan faydalı bilgi bulmaya/çekmeye odaklanırken, Web yapı madenciliği bağlantı yapılarını bulmaya ve bunları modellemeye çalışır. Bu iki kategori arasındaki ayrım bazen çok net değildir. Web kullanım madenciliği göreceli olarak daha bağımsız bir alan olup bu konuda şu çalışmalar sürdürülmektedir: Genel Web Kullanım Madenciliği, Site Modifikasyonu, Sistem İyileştirme ve Kişiselleştirme. Genel Web Kullanım Madenciliği log dosyalarına veri madenciliği tekniklerini uygulayarak genel akımları ve paternleri bulmayı hedefler. Site Modifikasyonu sistemleri sitelerin içerik ve yapısında iyileştirmeler önererek site tasarımını iyileştirmeye çalışır. Sistem İyileştirme, web trafiğini iyileştirmek için web madenciliği yapar. Son olarak, kişiselleştirme sistemleri kullanıcılarının tercihlerini anlamayı ve web sitelerini kişisel hale getirmeyi amaçlar. Bu teze konu çalışma, İYTE Web Kullanım Madenciliği Sistemi; Genel Web Kullanım Madenciliği alanında esnek SQL (Yapısal Sorgulama Dili) sorgulama yeteneklerini kullanan veritabanı yaklaşımına bir örnek teşkil etmektedir. İzmir Yüksek Teknoloji Enstitüsü web sitesinin erişim/hata/kullanıcı log dosyaları üzerinde veri madenciliği ve veritabanı teknikleri uygulanmıştır. Web yöneticisi için, web sunucusuna gelen taleplerin zamana, kullanıcılara, servis ve URL tiplerine gore dağılımlarını, web server tarafından oluşturulan hataların dağılımları ile birlikte bildiren, web sitesi iyileştirmesinde kullanabileceği bir araç oluşturmak hedeflenmiştir. Tüm veri temizleme ve kayıt tanıma işlemleri Java'da kodlanmış yazılımlar ile yapılmıştır. Temiz kayıtlar İYTE Web Kullanım Madenciliği ilişkisel veri tabanına ivaktarılmıştır. Veriden bilgi elde etmeye dönük sorgulamalara ek olarak SQL'in esnek özelliklerini kullanarak Apriori algoritması uygulanmış ve en sık ziyaret edilen URL çiftleri bulunmuştur.
dc.description.abstractABSTRACT Web mining is a very hot research topic, which combines two of the active research areas: Data Mining and World Wide Web. The Web mining research relates to several research communities such as Database, Statistics, Artificial Intelligence and Visualization. 'Although there exists some confusion about the Web mining, the most recognized approach is to categorize Web mining into three areas: Web content mining, Web structure mining, and Web usage mining. Web content mining focuses on the discovery/retrieval of the useful information from the Web contents/data/documents, while the Web structure mining emphasizes to the discovery of how to model the underlying link structures of the Web. Sometimes the distinction between these two categories is not very clear. Web usage mining is relatively independent, but not isolated category, in which the following studies continue; General Web Usage Mining, Site Modification, Systems Improvement and Personalization. General Web Usage Mining systems aim to discover general trends and patterns from the log files by adapting data mining techniques. The objective of the Site Modification systems is to improve the design of a web site by suggesting modifications in its content and structure. The research on System Improvement focuses on using the web usage mining for improving the web traffic. Finally, personalization systems aim to understand individual trends used for personalizing the web sites. `.., The study subject to this thesis, IYTE Web Usage Mining (WUM) System was an example of system development in the field of General Web Usage Mining with a database approach whetfe the flexible query capability of SQL (Structured Query Language) was explored. The data mining and database techniques were applied on the access/error/user logs of the web server of Izmir Institute of Technology. The main objective was to create a site improvement tool for the web administrator by reporting the distribution of the hits received by the web server according to the time stamp, users, service and URL types and at the same time revealing the nature of the errors generated by the web server. All data cleaning and transaction identification processes were handled by the software routines coded in Java. Clean transactions were imported into uIYTE Web Usage Mining (IYTE WUM) relational database. Flexible features of SQL were utilized for application of algorithm Apriori to discover most frequent pair of URL's visited, in addition to extraction of general knowledge from data. uien_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleFinding and evaluating patterns in web repository using database technology and data mining algorithms
dc.title.alternativeVeri tabanı teknolojisi ve veri madenciliği algoritmaları kullanarak web ortamındaki veriden paternler bulmak ve değerlendirmek
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentDiğer
dc.subject.ytmWeb
dc.subject.ytmData mining
dc.identifier.yokid128591
dc.publisher.instituteMühendislik ve Fen Bilimleri Enstitüsü
dc.publisher.universityİZMİR YÜKSEK TEKNOLOJİ ENSTİTÜSÜ
dc.identifier.thesisid121008
dc.description.pages69
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess