An intelligent database interface for Turkish
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tezde, veri tabanlarıyla Türkçe iletişim kurmayı hedefleyen, taşınabilir bir doğal dil arabirim sistemi geliştirilmiştir. Sistem, bir Türkçe sorgulama ifadesini önce ara birim anlam temsili dili olan D&Q'ya, daha sonra da hedef veri tabanı dili SQL`e çevirerek iki aşamalı bir dönüştürme işlemi gerçekleştirmektedir. Sistem, dil işleme, iç sorgulama ve SQL'e çeviri gibi birbirinden farklı üç aşamanın herbiri için kullanım alanından bağımsız modüllerden oluşmuştur. Modüller, içinde kullanım alanı ve veri tabanı hakkında çeşitli bilgilerin saklandığı bilgi tabanına başvururlar. Sistemin parçası olan diğer iki ek modül de imla düzelticisi ve tarih kaydedicisidir. Sorgulamaların analizinde sentaktik bir ayrıştırıcı kullanılmaktadır. Sentaktik ayırıcı için, sözcükler arasında anlam niteleme nosyonuyla bütünleştirilmiş basit genel kategorizasyon ilkesi üzerine kurulan bir Türkçe gramer altkümesi formalizasyonu önerilmekte ve cümlelerin formel temsilleri için kullanılan yeniden yazma kuralları kümesinden oluşan bir gramer tartışılmaktadır. İsimlerin morfolojik ayrıştırılmasmda sonekleri atarak çalışan bir karar ağacı yaklaşımı kullanılmaktadır. Formelleştirilmiş gramerden yararlanarak farklı tipde cümleler için üretilen ayrıştırma ağaçları verilmektedir. Anlam temsili bakımından da, kurala dayalı akıl yürütme yeteneğine sahip akıllı' bir anlam temsili üreticisi tasarlanmıştır. Bazı anlam aiteleme ilişkilerinin yorumlanmaları da ayrıntılı biçimde tartışılmaktadır. Son olarak da tam bir cümlenin yorumlanışı gösterilmektedir. Sistem, hayali bir öğrenci-ders-hoca veri tabanı üzerinde denenmiştir ve tezdeki tüm örnekler bu veri tabanına dayanmaktadır. Tezin sonunda da ayrıştırıcı -ve anlam temsili üreticisi için olası geliştirmeler üzerinde durulmaktadır. In this thesis, a portable natural language interface system for communicating with databases in Turkish is developed. The system does a two step transformation from a Turkish query in user's view to an intermediate meaning representation language D&Q and finally to a target database language SQL. It is composed of domain independent run time modules for different processing stages, namely language processing, internal query generation and translation to SQL. Modules refer to the knowledge base in which diverse knowledge about the domain and the database are maintained. Two additional modules, to wit a spelling corrector and a history keeper are incorporated in the system. A syntactic parser is used in analyzing queries. For the syntactic parser, a formalization of a subset of Turkish grammar based on the simple principle of general categorization incorporated with the notion of modifications between words is proposed and a grammar that consists of a collection of rewrite rules for the formal representation of sentences is discussed. A decision tree which works with suffix strip off approach is used for the morphological parsing of nouns. Parse trees produced for different types of sentences using the formalized grammar are given. Regarding to the meaning representation, an `intelligent` meaning representation generator which has a rule based reasoning capability is designed. The interpretations of some modification relations are discussed in details. Finally the interpretation of a full sentence is shown. The system is tested on an imaginary studettt-course-instructor database, all examples refers to this database. Possible extensions for both the parser and the meaning representation generator are also proposed at the end of the thesis.
Collections