Joint learning of morphological segmentation, morpheme tagging, part-of-speech tagging, and dependency parsing
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bitişimli dillerde biçimbilim ve sözdizim arasında güçlü bir ilişki vardır. Çekim ve yapım eklerini sözcüğün sözdizimsel rolünün belirlenmesinde etkili olmaktadır. Sözdizim ve biçimbilim arasındaki bu bağlantı ikisinin eşzamanlı öğrenilmesini olanaklı kılmaktadır. Bunun yanında dildeki karmaşık morfolojinin varlığı seyreklik problemine neden olabilmektedir. Bu nedenden ötürü morfolojik analiz ve işaretmele pek çok doğal dil işleme çalışması için zaruridir. Yukarıda sıralanan sebepler morfolojik analiz ve işaretleme, sözcük türlerinin bulunması ve bağlılık ayrıştırma gibi farklı sözdizimsel analizlerin yapılmasına teşvik etmektedir. Önerilen model çok katmanlı yapay sinir ağlarından oluşmaktadır. Her bir seviyede ardışık bilgiyi kodlayabilen iki yönlü uzun kısa vadeli bellek ağı birimleri bulunmaktadır. Buna ilaveten, morfolojik etiketleme bileşeninde kullanılan dikkat ağı yardımıyla kodlayıcı ve çözücü durumları arasındaki hizanlamanın kurulması amaçlandı. Her bir seviyeden elde edilen sonuçlar literatürdeki diğer çalışmalarla karşılaştırıldı. Evrensel Bağlılık Ağaç Yapılı veri kümesinde karşılaştırabilinir sonuçlar alındı. In agglutinating languages, there is a strong relationship between morphology and syntax. Inflectional and derivational suffixes have a significant role while determining the syntactic role of the word in the sentence. This connection enables the joint learning of morphology and syntax. Apart from that, the complex morphology poses a sparsity problem. In this respect, morphological analysis and segmentation are vital for various natural language processing applications. All of these have provided the primary motivation to develop a joint learning model for morphological segmentation, morphological tagging, part-of-speech (POS) tagging, and dependency parsing. The proposed model consists of a multi-layered neural network structure. In each level, there is a bidirectional long-short memory unit (BiLSTM) to encode sequential information. Additionally, attention networks are used to compute soft alignment between encoder-decoder states in the morphological tagging component. Finally, the obtained results from each layer of the network are compared with other works from the literature. The results are very competitive on Universal Dependencies (UD) dataset.
Collections