Probabilistic learning of Turkish morphosemantics by latent syntax
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Insanların dil işleme yeteneği, dilbilgisi olarak formalize edilen sözdizim ve anlambilim arasındaki arayüze bağımlıdır. Turkçe gibi morfolojisi zengin dillerde, morfoloji bu arayüze müdahale eder. Bu tez morfolojik anlambilgisiden ve kelimelerin içerisindeki örtülü sözdiziminden yola çıkarak ile onların anlamlarını keşfetmeyi amaçlamaktadır. Bu bağlamda, morfemlerin sözdizimsel kategorilerinden ve anlamsal öğelerinden oluşan bir morfem sözlüğü öğrenmek üzere bir model geliştirilmiştir. Kelimelerin içindeki olası morfemleri tespit etmek için kelimelerin dağılımsal özelliklerini kullanan bir bölümlenme algoritması, olası morfemlerin sözlük içindeki ağırlıklarını Öğrenme için ise olasılıksal ulamsal dilbilgisi kullanılmıştır. Yapım ekleri anlamları farklı yeni sözcükler ürettiği için, geliştirilen model çekim ekleri üzerine eğilmektedir. Tez kapsamında model test edilmiş ve sonuçlar farklı yönleri ile rapor edilmiştir. The language processing capability of humans is highly dependent on the transparent interface between syntax and semantics which is formalized as the grammar. Morphology also interferes with this interface, in languages having rich morphology such as Turkish. This thesis aims to discover word semantics in Turkish from the compositional morphosemantics by underlying latent syntax. A computational model has been developed to learn a morpheme lexicon in which each morpheme contains semantic information in logical form with a basic syntactic type. A knowledge-free segmentation algorithm based on distributional properties of words is used to extract pseudo-morphemes from words. We utilize a classical probabilistic CCG grammar for lexical learning. Since derivational changes can be handled with lexicalization of words, we employ our model for the inflectional morphemes in Turkish. The model has been tested and results obtained is reported in the thesis with various aspects.
Collections