Freeqa - bağlı veri üzerinde hibrid soru cevaplama sistemi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
`Soru cevaplama` (Question Answering) sistemleri doğal dilde verilen soruların bilgi tabanları kullanılarak cevaplanması problemi ile ilgilenmektedirler. DBpedia, Freebase, Yago gibi bağlı veri (linked data) kaynaklarının artması ile birlikte soru cevaplama sistemleri bu tür kaynakları daha yoğun olarak kullanmaya başlamışlardır. IBM Watson, Google Knowledge Graph, Wolfram Alpha, Siri bu tür sistemlere örnek olarak verilebilir. Bağlı veri üzerinden soru cevaplama sistemleri temelde yapısal (genelde RDF) veriler ile cevap vermeye çalışmaktadır. Ancak bu tür sistemlerde cevabı yapısal veri içinde yer almayan bazı sorular sadece yapısal veri ile cevaplanamamaktadır. Bu durumda bağlı verilerde yer alan yapısal olmayan verilerin de kullanılması ile sonuç alınabilmektedir. Buna `hibrid soru cevaplama` problemi denmektedir. Bu çalışmada hibrid soru cevaplama sistemine farklı bir bakış açısı sunulmaktadır. Bu sunulan çalışma da FreeQA diye adlandırılmaktadır. FreeQA, doğal dildeki soruları doğal dil işleme araçlarıyla işleyip sorgu kalıpları çıkarmaktadır ve sonrasında bu kalıplardan yararlanarak, bağlı veri üzerinde çalıştırılabilir ve bir cevap alınabilir SPARQL sorguları oluşturmaktadır. FreeQA, ilk olarak mümkün olan tüm sorgu kalıplarıyla bir sorgu ağacı oluşturmaktadır ve bu ağaç üzerinde aç gözlü arama (greedy search) stratejisi ile arama yaparak tekil SPARQL sorguları elde etmektedir. Bu stratejiyi kullanarak FreeQA değerlendirildiğinde 45 adet hibrid sorusu içinden 37'sine cevap verilmektedir, bunlardan 33 tanesine doğru cevap ve 4 tanesine de kısmen doğru cevap verebilmektedir. Question answering deals with natural language questions that can be answered using knowledge resources. With increasing in linked data resources such as DBpedia, Freebase and Yago, question answering systems start to use these types of resources more intensively. IBM Watson, Google Knowledge Graph, Wolfram Alpha, Siri can be example for these systems. Question answering systems over linked data basically try to answer using structured data. However, not all questions can be answered using only structured data. In such cases, textual or unstructured data, which are present in linked data as abstracts, labels, etc., can be utilized to answer such queries. This is called hybrid question answering. In this thesis, there is a different approach to hybrid question answering called FreeQA. This system utilizes natural language tools to map natural language questions to query templates and then to SPARQL queries, which can then be executed on linked data to answer the questions. FreeQA first builds a query tree with possible query templates and uses greedy search strategy to form the final SPARQL query. FreeQA can answer 37 of the 45 hybrid questions in the dataset, of which 33 of them are answered correctly and 4 of them are partially correctly answered.
Collections