Bağlantılı veri kaynaklarının tespiti ve analizine ilişkin yeni bir yöntem
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Anlamsal ağlar ve bağlantılı veri, çevrim içi veri akışlarını düzenlemek, veri yığınlarını anlamlı hale getirerek bağlantılandırmak ve sonuç olarak kolay sorgulanabilir ve erişilebilir bir düzen içerisine koymak üzere tasarlanmıştır. Bu bağlamda internet sunucularında saklanan veri çöplüklerinin birer dağıtık veri kaynağı haline dönüştürülerek, farklı bölgelerden anlamsal sorgular ile sorgulanabilmesi amaçlanmaktadır. Bu veri kaynaklarının sorgulanması amacıyla geliştirilmiş olan SPARQL sorgulama dili kullanılarak SPARQL uç noktalarına bağlı olan bağlantılı veri kaynakları sorgulanabilmektedir. SPARQL uç noktaları, bağlantılı veri kaynaklarının bağlantı noktaları üzerinden temel HTTP veya SOAP benzeri protokoller ile sorgulanabilmesi amacıyla geliştirilen servislerdir. Çevrim içi bağlantılı veri kaynaklarının sorgulanmasına olanak veren bu uç noktalar, internet üzerinde dağınık olarak bulunmakta ve kullanıcılar tarafından kolaylıkla tespit edilememektedir. Bu veri kaynaklarını ve bağlı olan uç noktaları, kullanıcılar tarafından kolay erişilebilir kılmak amacıyla listeleyen çeşitli çalışmalar olmakla birlikte, bu çalışmaların yetersiz olduğu bu tez çalışmasıyla tespit edilmiştir. Bu yetersizliği giderebilmek amacıyla, SPARQL uç noktalarını otomatik olarak tespit eden, sürekli gözlem ve analizlerini gerçekleştirebilen bir meta-arama ve analiz aracı geliştirilmiştir. Tespit edilen SPARQL uç noktalarının kullanıcılar tarafından kullanılabilmesini sağlamak amacıyla da sınıflandırma, konu önerme, etiketleme gibi işlemler uygulanmıştır. Bu tez çalışmasında, SPARQL uç noktalarının tespit edilmesi aşamasından, içerik analizi yapılarak kullanıcılara sunulabilmesi aşamasına kadar olan tüm süreçler açıklanmaktadır. Tespit edilen tüm uç noktalar ve bunlara bağlı çıkan sonuçlar, mevcut diğer benzer çalışmalarla karşılaştırılmıştır. Semantic web and linked data are designed to organize online data flow, link and semantify data stacks, and consequently provide easily queriable and accessible data stores. In this manner, data dumps stored in internet servers are converted into a distributed data source and become available for semantic querying from different locations. In order to provide a querying infrastructure for these data sources, SPARQL querying language was designed. SPARQL query language is used to query SPARQL endpoints, which allows users to query linked data sources through HTTP or SOAP-like protocols. These endpoints are distributed among internet and allows users to query several different data sources. Although there are many endpoints on the web, the discovery of these endpoints is not an easy task for the users. There are studies and repositories to provide link data sources for data consumers; however, the quality and the quantity of these studies are limited. In order to enhance these studies, a discovery and analysis engine is developed to discover and continuously analyze SPARQL endpoints. After the SPARQL endpoint repository creation, classification, topic recommendation, and tagging techniques for SPARQL endpoints are developed. In this thesis, the complete process starting from the discovery to the content analysis and serving of the results are explained. The results coming from the developed engine are compared with other similar studies.
Collections