Time domain based web usage mining for web site improvement
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
ÖZET WEB SİTE GELİŞİMİ İÇİN ZAMANA BAĞIMLI WEB KULLANIM MOTİFLERİNİN ÇIKARILMASI Alpay Erdem Bilgisayar Mühendisliği, Yüksek Lisans Tez Yöneticileri: Yrd. Doç. Dr. Attila Gürsoy and Yrd. Doç. Dr. Uğur Doğrusöz Mart 2002 Web kullanımının artması ile birlikte siteler üzerinde sunucu log dosyalarında saklı olan Web kullanıcı verileri kullanıcı motiflerinin incelenmesi amacına yönelik işlenebilir durumdadır. Bağlantılarla gösterilen Web site tasarımı etkin Web içerik sunumu açısından oldukça önemlidir. Web Kullanıcı Motiflerinin işlenmesi kullanıcı motiflerinin yardımıyla Web sitesindeki eksiklikleri tespit ederek Web yapısının iyileştirilmesinde kullanılabilir. Web siteleri ortalama kullanıcıların etkin bir şekilde kullanabilmeleri için tasarlanmış olsa da sayfalar arasındaki kavramsal bağıntılar ve say faların sınıflandırılması kullanıcıların beklentilerini karşılamayabilir. Yanlış yönlendirmeler içeren Web sayfa tasarımı kullanıcıların yanlış yollar deneme sine sebep olarak ulaşmak istedikleri hedef sayfalara çok daha fazla zaman har cayarak ulaşması veya `sanal-boşlukta` hedefine ulaşamaması ile neticelenir. Bununla birlikte kullanıcıların zamanla ilgi odaklarının değişmesi ile birlikte kul lanıcı ihtiyaçlarına yönelik olarak Web sitesi tekrar düzenlenmelidir. Bu ne denle, en çok ziyaret edilen popüler sayfalar kolaylıkla ulaşabilmeli, kavramsal olarak birbirine yakın olan sayfalar birlikte kategorize edilmeli veya birbirler ine bağlantılarla ulaşabilmeli ve hatalı yönlendirici içeriğe sahip sayfalar tespit edilmelidir. Bununla birlikte yalnızca sık sıralamaların bulunmasi Web sitesinin geliştirilmesi için yeterli değildir. Çünkü sık sıralamalar ilgi duyulan sayfaları içerdiği gibi kullananın hedefine ulaşırken denemiş olduğu gereksiz sıralamaları da içerir. Geri sık sıralamalar gereksiz yere izlenen sıralamaları ve aynı zamanda ilgili sayfaların ilgilenilen veya ilgilenilmeyen sayfalar olmalarına göre farklılaşan bilgileri içerir. Bu tezde, ileri ve geri sık sıralamaların yorumlanması amacı ile her sayfa için sayfanın izlenme süresini bulmada kullanılan zaman boyutunu sıralamalara ekledik. Her sayfada bir sıralama dizisi içinde diğer sayfalara oranla sayfanın izlenmesi için harcanan zaman o sayfaya kullanıcının ilgi kriteri olarak kullanılabilir. vVI Bu amaçla, Web sitesinin iyileştirilmesine yönelik tekrar tasarlanması için önerilerde bulunan Web kullanım motifleri işleyen bir yöntem önerilmiştir. Kul lanıcının hedefine ulaşıp ulaşmadığı hatalı yönlendirmenin bulunması açısından önemlidir. Bununla birlikte, çoğu zaman geri dönüşlerin kullanımı ile uzun yollar izlenerek ilgili diğer sayfalara geçiş bu sayfaların bağlanması gerektiğini gösterir. Ancak bu şekildeki motiflerin yakalanabilmesi için zaman boyutunun kullanılması gerekmektedir. Kullanıcı motiflerinin işlenmesi kısmında tüm kullanıcı sayfa zi yaret sıralamaları ileri ve geri sıralamalar da dahil olmak üzere ve sayfa istem havuzundan getirilen sayfaların bulunması ve her sayfa üzerinde harcanan za manın bulunması problemlerinin göz önüne alındığı sıralamalar bir bütün olarak incelenmiştir. Popüler sayfalara kısayol ekleme, ilgili sayfaların bağlanması ve hatalı yönlendirici sayfaların bulunması amacı ile sık motiflerin buluması ve yo rumlanması kısmında ilgi kullanıcılar tarafından ilgi duyulan motifler ve gereksiz olanlar bulunmuştur. Anahtar sözcükler: Web Kullanıcı Motifleri, Web Sitesi Gelişimi, Sıralama Çıkarımı, Web Veri Çıkarımı.. ABSTRACT TIME DOMAIN BASED WEB USAGE MINING FOR WEB SITE IMPROVEMENT Alpay Erdem M.S. in Computer Engineering Supervisors: Assist. Prof. Dr. Attila Gürsoy and Assist. Prof. Dr. Uğur Doğrusöz March 2002 With the increased use of Web, large volumes of click-stream data, embed ded inside server logs, has become available for revealing user access patterns especially on specified Web sites. Efficient Web content presentation conveyed through links structure is a very important issue for efficient use of site. Web Usage Mining can be used to improve Web site design by finding deficiencies of the Web site by analyzing user access patterns. Although Web sites are intended to be designed for efficient usage for typical users, mostly conceptual relations between pages and categorization proposed by Web site designer may not meet expectations of the users. Misleading Web site design leads to users spending much more time for reaching target pages by reasoning redundant paths to be followed or lost in cyber-space without finding the target. Furthermore, changing needs and interests of users by the time require re-structuring of the Web site. Therefore Web sites should be updated according to user expectations. For that reason, most popular pages should be easily accessed, conceptually related pages either should be categorized close enough or should be linked and misleading guidance directing users to different pages other than target should be detected. However, barely finding frequent sequences is not sufficient for improving a Web site. This is because of the fact that explored frequent patterns cover both interested patterns used for reaching popular sites and redundant patterns that are followed previous to reaching target page(s). Frequent backward references embed knowledge of redundant and also related pages according to interest in these pages. In order to interpret backward and forward references in terms of interest we incorporated time domain that finds page viewing timing for each visited page. Relatively spent page viewing time for each page within a session is an important interest criterion for that page, a_.IV For that purpose, we proposed a Web usage mining framework that explores deficient points in the web site design according to user expectations. Whether user reached or not indicates misleading-guidance. Besides, jumping to related pages by using long paths, in many cases backtracks, shows that those pages should be linked. However, in order to be able to capture such patterns, page view time of each page is used. This franework advises re-design suggestions for Web site improvement. In the usage processing part of this framework, all user navigation sessions are analyzed and both forward and backward references are obtained by considering cached pages and also page viewing timing is computed for each page. In the mining process and interpretation part, frequent inter ested and redundant patterns are explored and interpreted for enabling popular pages more visible, linking related pages, reporting misleading categorization and detecting misleading guidance or categorization. Keywords: Web Usage Mining, Web Site Improvement, Sequence Mining, Web Mining..
Collections