Türkçe için sözcük etiketleme ve cümle türü tespit yöntemi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Teknolojinin hayatımızdaki yeri arttıkça dillerin de sayısal ortamdaki kullanımı ve önemi artmıştır. Bu nedenle, çalışmamızın ana motivasyonu Türkçe cümlelerin sayısal ortamlarda doğru anlaşılması için yöntemler geliştirmektir.Çalışmamızda, anlamına göre tür tespitinin sayısal ortamda nasıl yapılacağı incelenmiştir. Bunun için; Tarık Kışla'nın yapmış olduğu çalışmanın performansı iyileştirilerek ve çalışma platform bağımsız bir yapıya dönüştürülerek sözcük türü tespiti ve gövdeleme işlemi yapılmıştır. Önce Gizli Markov Modelleri ve Viterbi algoritmasıyla cümledeki sözcüklerin türleri belirlenmiş ve sonra da sözcüklerin gövde ve ekleri tespit edilmiştir. Bu verileri kullanan kural tabanlı bir yöntemle cümlenin anlamına göre türü olumlu cümle, olumsuz cümle, olumlu soru cümlesi ve olumsuz soru cümlesi olarak etiketlenmiştir. Sözcük türü tespit, gövdeleme ve cümle türü tespit yöntemleri test edilmiş ve sonuçlar; ilgili konular üzerinde daha önce yapılan çalışmalarla kıyaslanmıştır. As the technology diffuses more and more in our lives, the usage and prominence of languages increases in the digital environment. For this reason, the main motivation of our study is to develop methods for understanding of Turkish sentences correctly in the digital world.In our work, it has been examined how to determine automatically the type of a sentence according to its meaning. For this; the performance of part of speech tagging and stemming task developed by Tarık Kışla has been improved and transformed into a platform independent structure. The types of the words in the sentence were first determined using the Hidden Markov Models and the Viterbi algorithm and then the stems and suffixes of the words were determined. With a rule-based method that uses this data, the type of sentence according to its meaning as positive sentence, negative sentence, positive interrogative sentence, negative interrogative sentence, has been labeled. Determining type of sentence according to its meaning, part of speech tagging and stemming methods were tested and the results have been compared with previous works on related topics.
Collections