Automatic hyperlink generation
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günümüzün en önemli buluşlarından biri hiç şüphesiz internettir. Her an dünyanın herhangi bir yerinden yüzlerce milyon kişi internete girebilmektedir. İnternet ortamında ağ sayfaları HTML formatında gösterilmekte ve ağ sayfalarına erişim hiperlinklerle gerçekleşmektedir. Genel olarak hiperlinkler kullanıcılar tarafından el ile manüel olarak tanımlanırlar. Bu tezin amacı hiperlinkleri otomatik olarak oluşturacak bir sistem tasarlamaktır.Bu amacı gerçekleştirmek için SeaGEN isimli bir robot geliştirilmiştir. SeaGEN ağ sayfalarını analiz ederek çeşitli kelime ve deyimler için hiperlinkler oluşturmaktadır.Bu çalışmada hiperlinkler oluşturmak için veri madenciliği tekniklerinden yararlanılmıştır. Önce bir sınıflandırma sistemi geliştirilmiştir. Vikipediden deneme amaçlı bir veri seti alınmıştır. Sınıflandırma sistemi deneme seti üzerinde test edilmiştir. Bu sınıflandırma için WEKA isimli, açık kaynak kodlu bir veri madenciliği yazılımı kullanılmıştır. Uygulama sonunda, test edilen sınıflandırma sisteminin, belirlenen ağ sayfaları için hiperlinkleri otomatik olarak oluşturduğu tespit edilmiştir. One of the most important inventions of today is the Internet. Hundreds of millions of people anytime, from anywhere, can enter the Internet. On the Internet web pages are represented in HTML format and pages are linked through hyperlinks. Normally hyperlinks are defined by users manually. The objective of this thesis is to design a system that generates hyperlinks automatically.For this objective, a robot called SeaGEN has been developed. The robot SeaGEN analyses a web page and generates hyperlinks for certain words/phrases.During this Master study data mining techniques were used to generate hyperlinks. A classification system was developed. A training dataset was collected from Vikipedi. This training set was used for training the classification system. WEKA open source data mining software program was used for classification. The trained classification system generates hyperlinks automatically for a given set of pages.
Collections