Show simple item record

dc.contributor.advisorEyler, M. Akif
dc.contributor.authorTatar, Serhan
dc.date.accessioned2020-12-10T09:25:22Z
dc.date.available2020-12-10T09:25:22Z
dc.date.submitted2002
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/230083
dc.description.abstractÖZET WEB KAYNAKLARINDAN BİLGİ SAĞLANMASI VE MANİPÜLASYONU İnternette başlıca gezinim tekniği bağlantıları kullanarak bilgiye ulaşma ve anahtar kelimeleri kullanarak aramalar yapmaktır. Fakat, internetin devasa büyüklüğü düşünüldüğünde bu tekniklerin yeterli olmadığı görülmektedir. Ayrıca, diğer bir problem de heterojen yapılarda bulunan bilginin belirli bir veri modeli ve biçimi içinde sunulabilmesidir. Bu tezde, WebXtractor isimli sistem anlatılmış ve geliştirilmiştir. Sistem temel olarak Web kaynaklarından bilgi elde edilmesini ve elde edilen bilginin rafine hale getirilmesini sağlamaktadır. Özellikle, internetten veri aktarma işlemlerinde oldukça etkili bir şekilde kullanılabilmektedir. WebXtractor' un sahip olduğu başlıca özellikler aşağıda sıralanmıştır:. Kaynakların internetten otomatik olarak getirilmesi ve ayrıştırılması. Kaynaklardan otomatik olarak kullanıcının belirttiği bilginin ayıklanması. Kaynakların ilişkilendirilmesi. Veri modeli tasarımı. Görsel araçlar sayesinde hızlı ve kolay uygulama geliştirme imkanı WebXtractor sistemi içerisinde, kullanıcının sistemi kolayca yapılandırabilmesi için 3 araç geliştirilmiştir. Tez içerisinde bu araçların nasıl kullanıldığı ve WebXtractor ile nasıl uygulama geliştirileceği konulan da detaylı bir şekilde anlatılmıştır. Ayrıca sistemin kullanımını anlatan örnek uygulamalar gerçeklenmiş ve gösterilmiştir. Bu uygulamalardan ilkinde, Web üzerinde bulunan çoklu bir veri iv ÎSSSSRBSTkaynağından elde edilen bilgi entegre hale getirilmiş ve kullanıcının istediği veri modeli ve biçimi içerisinde kullanıcıya sunulmuştur. İkinci uygulamada ise tek bir dokümandan oluşan kaynaktan elde edilen bilgi sadece biçim değişikliği yapılarak kullanıcıya sunulmuştur. Anahtar Kelimeler: World Wide Web, Web kaynaklan, bilgi ayıklama Ağustos, 2002 Serhan TATAR
dc.description.abstractABSTRACT INFORMATION EXTRACTION AND MANIPULATION SYSTEM FOR THE WEB SOURCES Clicking on links and using keyword search for links is the main navigation technique in the Internet. However, it seems that the method is not useful when we consider the enormous size of the Internet. Moreover, another important problem is presentation of the information, which is stored in heterogeneous structures, in a specified data model and format. In this thesis, WebXtractor system is described and developed. The system is used to extract information from the Web sources and refine the extracted information. Especially, when migrating data from the Web, the system can be used efficiently. Main features of WebXtractor include:. Automatic retrieval and parsing of the Web sources. Automatic information extraction. Source integration. Data model design. Easy and rapid application development facilities by the help of visual tools In WebXtractor system, three tools were developed for user to configure the system easily. In the thesis, the toolkit was analyzed in detail. In addition, application development in WebXtractor was explained. Sample applications that show the usability of the system were also implemented and shown. In the first example, data that is stored on a multiple-instance Web source was integrated and the integrated VIinformation was presented to user in user-specified data model and format. In the second example, data that is stored on a single-instance Web source was presented to user in user-specified format. Keywords: World Wide Web, Web sources, information extraction August, 2002 Serhan TATAR Vllen_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/embargoedAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleInformation extraction and manipulation system for the web sources
dc.title.alternativeWeb kaynaklarından bilgi sağlanması ve manipülasyonu
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentDiğer
dc.subject.ytmWWW
dc.subject.ytmInformation sources
dc.subject.ytmInternet
dc.identifier.yokid129745
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityMARMARA ÜNİVERSİTESİ
dc.identifier.thesisid126562
dc.description.pages61
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/embargoedAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/embargoedAccess