Dağıtık bağlı veri sorgulama motorlarında performans yönetimi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bağlı veri ilkeleri ile veb, sayısı her geçen gün artan dağıtık ve birbirine bağlı veri kümelerinin tek bir veritabanı gibi sorgulanabileceği bir veri uzayına dönüşmüştür. Sorguyu kullanıcıların yerine, bu veri kümeleri üzerine dağıtan ve etkin şekilde sorgulayan birleştirilmiş sorgu motorları ile bu veriden çok daha iyi şekilde yararlanılabilmektedir. Bu tez kapsamında VOID üstverilerini kullanan birleştirilmiş SPARQL sorgulama motoru olan WoDQA üzerinde gerçekleştirilen performans iyileştirme yöntemleri anlatılmaktadır. WoDQA birbirine bağlı veri kümelerinin üstverisini ve üçlü desenleri arasındaki ilişkileri, veri kümesi seçim yöntemine dahil eder. Tez kapsamında WoDQA'nın oluşturduğu birleştirilmiş sorgunun eniyileştirilmesi için sezgisel yöntemler kullanılmıştır ve eniyileştirilen bu sorgunun etkin ve hızlı bir şekilde çalıştırılıp sonuçların da hızlıca elde edilmesi için SPARQL FILTER tabanlı bağlı birleştirme yöntemi uygulanmıştır. Bu yaklaşımlar FedBench değerlendirme kütüphanesi ile değerlendirilmiş ve WoDQA'nın seçim ve işletim yaklaşımları üzerinde olumlu etkisi ortaya konmuştur. Ayrıca birleştirilmiş SPARQL sorgu doğasına uygun bir SPARQL önbellekleme mimarisi gerçekleştirilmiştir. Mimaride SPARQL sorgularının cevapları üçlüler olarak, her bir üçlünün bellekte yalnızca bir kez yer alacağı şekilde tutulmaktadır. Böylece önbellek etkin olarak yönetilerek sorgular hızlıca çalıştırılabilmektedir. Önbellek mimarisi tekil ve birleştirilmiş SPARQL sorguları ile deneysel olarak değerlendirilmiş ve WoDQA'nın performansına olan iyileştirici etkisi ortaya konmuştur. Anahtar sözcükler: Dağıtık Sorgulama, Birleştirilmiş Sorgular, Bağlı Veri, SPARQL, Anlamsal Veb, Değerlendirme, Eniyileştirme, Önbellekleme. With the linked data principles web evolved into a dataspace in which increasing number of datasets can be queried as a single database. Using the federated SPARQL query engines, which federate queries on datasets and can query effectively in spite of users, it is possible to benefit much beter from this data. In this thesis, performance improvements on WoDQA, which is a linked data query engine that depends on VOID metadata, will be presented. WoDQA incorporates interlinking metadata between datasets and the relations between triple patterns of a query into dataset selection. Within the thesis, some heuristics for query optimization and a SPARQL FILTER keyword based bound join implementation for query execution are employed. The performance of these approaches are evaluated using FedBench suite, and the improvement provided by the selection and execution approach of WoDQA is shown. Besides a SPARQL caching architecture that fits perfectly to the nature of federated SPARQL queries is implemented. In the architecture, the results of SPARQL queries are stored as triples and somehow each triple must reside in memory only once. Thus queries can be executed faster while cache is managed efficiently. The SPARQL cache approach is evaluated with single and federated SPARQL queries, and its improvement to the performance of WoDQA is presented. Keywords: Fedeated Querying, Federated Queries, Linked Data, SPARQL, Semantic Web, Evaluation, Optimization, Caching.
Collections