Automatic sense prediction of explicit discourse connectives in Turkish with the help of centering theory and morphosyntactic features
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Söylem bağlaçları (ve, ama, ancak vb.), söylemi tutarlı halde tutmanın birçok yönteminden biridir. Söylem bağlaçları, anlamları bakımından sınıflandırılmışlardır. İki söylem ünitesinin aralarındaki anlamsal ilişkiyi tanımlamaktadırlar. Bu çalışma, bir makine öğrenmesi sistemi geliştirerek, Türkçe Söylem Bankası'ndaki (TDB) açık söylem bağlaçlarının anlamlarını belirlemeyi hedeflemektedir. Bu hedefi gerçekleştirmek için çeşitli özelliklerin etkileri incelenmiştir. Bu özellikler, Merkezleme Teorisi'nin geçişleri ve söylem bağlantılarındaki ünitelerin morfo-sentaktik yapılarıdır. Sonuçlar, Merkezleme Teorisi özelliklerinin, morfo-sentaktik yapıların ve bunların birleşimlerinin her bir anlam sınıfını farklı yönde etkilediğini öne sürmektedir. Sadece söylem bağlaçlarıyla hesaplanan taban skor göz önünde bulundurulunca Merkezleme Teorisinin eklenmesi, Karşılaştırma ve Açımlama sınıflarının tahmin skorlarını arttırmıştır. Ayrıca, Zaman, Görünüş ve Kiplik özelliklerinin Zamansal sınıfını olumlu yönde etkilediği gözlemlenmiştir. Discourse connectives (and, but, however) are one of many means of keeping the discourse coherent. Discourse connectives are classified into groups based on their senses (expansion, contingency, etc.). They describe the semantic relationship of two discourse units. This study aims to build a machine learning system to predict the sense of explicit discourse connectives on the Turkish Discourse Bank data, which is manually gold-annotated. To do so, this study examines the effect of several features: i.e. transitions of Centering Theory and morphosyntactic characteristics of main verbs of the arguments in a discourse relation. The results imply that Centering Theory, morphosyntactic features and their combinations affect each class of sense in a different way. When the base score is calculated with only the connective feature, the addition of Centering Theory features seems to have increased the predictions scores for Comparison and Expansion classes. Also, Tense, Aspect and Modality features are observed to slightly affect the Temporal class in a positive way.
Collections