Word sense disambiguation for Turkish lexical sample
dc.contributor.advisor | Orhan, Zeynep | |
dc.contributor.author | Özdemir, Vildan | |
dc.date.accessioned | 2021-05-07T11:39:56Z | |
dc.date.available | 2021-05-07T11:39:56Z | |
dc.date.submitted | 2009 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/616044 | |
dc.description.abstract | Sözcük anlamını belirginleştirme, kelimenin birden fazla anlama sahip olması durumunda, yer aldığı cümledeki konumu ve diğer kelimelerle ilişkisine göre anlamının belirginleştirilmesi işlemidir.Bu çalışmada Türkçe metinler içerisinde anlam belirsizliğine sahip olan sözcükler için uygun özellik ve algoritmaların seçilerek, anlam belirginleştirme işleminin nasıl yapıldığı anlatılmaktadır. Türkçenin zengin dil yapısı içerisinde birden fazla anlama sahip dört örnek kelime seçilerek bu kelimeler için anlam belirginleştirme çalışması yapılmıştır. Bu çalışmaların yapılacağı işaretlenmiş metinlerin eksikliği sebebiyle öncelikle seçilen örnek kelimeleri içeren cümlelerden oluşan veriler toplanmıştır. Daha sonra çalışmada seçilen kelimeler için anlamın ayırt edilmesini sağlayan özellikler belirlenmiş ve Öğreticili Öğrenme algoritmaları verilere uygulanmış, değerlendirme yöntemleri ile elde edilen sonuçlar değerlendirilmiştir.Yapılan test işlemlerinde anlam belirginleştirmesi için NaiveBayes, Kstar, SimpleCart ve Bagging algoritmaları kullanılmıştır. Ayrıca kelimeler için çalışmada etkili olabilecek özellikler belirlenmiştir. Seçilen bu algoritmaların ve özelliklerin ne kadar etkili oldukları ortaya konmuştur. Bundan sonraki çalışmalar için göz önünde bulundurulması faydalı olabilecek noktalara genel olarak değinilmiştir. | |
dc.description.abstract | Word Sense Disambiguation (WSD) is the process of disambiguation of the sense of a word when the word has more than one sense using the position of the word in a sentence, and the relation of the word with other words in the sentence.In this thesis, the process of WSD is explained for the words in Turkish which has sense disambiguity by choosing appropriate features and algorithms. In the rich language structure of Turkish, four example words which have more than one sense, have been selected and the WSD study has been performed for these words. Due to the lack of sense annotated text to be able to do these types of studies, first the data was collected composed of sentences containing the sample words chosen. Then the features that discern the sense of the word have been identified, Supervised Learning algorithms have been applied to the data, and the results obtained using evaluation methods have been interpreted.For sense disambiguation, NaiveBayes, KStar, SimpleCart and Bagging algorithms have been used in the test processes performed. Furthermore the features for the words have been identified that are believed to be effective in the study. The effect of the selected algorithms and features has been shown. The points that will be useful to be considered for the studies to come in this area have been mentioned. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.subject | Dilbilim | tr_TR |
dc.subject | Linguistics | en_US |
dc.title | Word sense disambiguation for Turkish lexical sample | |
dc.title.alternative | Türkçe sözcük örnekleri için sözcük anlamlarının belirginleştirilmesi | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Bilgisayar Mühendisliği Ana Bilim Dalı | |
dc.subject.ytm | Natural language processing | |
dc.identifier.yokid | 344867 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | FATİH ÜNİVERSİTESİ | |
dc.identifier.thesisid | 244915 | |
dc.description.pages | 95 | |
dc.publisher.discipline | Diğer |