Tagging ambiguous word classes in Turkish
dc.contributor.advisor | Aksan, Sera Yeşim | |
dc.contributor.author | Atasoy, Gülsüm | |
dc.date.accessioned | 2020-12-10T08:17:51Z | |
dc.date.available | 2020-12-10T08:17:51Z | |
dc.date.submitted | 2011 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/220887 | |
dc.description.abstract | Bu çalışma, Türkçe'de belirsiz sözcük türlerinin işlev ve sıklık dağılımına dayalı derlem temelli betimlemesini Sunmaktadır.Çalışmanın ilk bölümü, sözcük türü sınıflandırmalarını, Türkçe'de sözcük türü işaretlemelerini ve karşılaşılan belirsizlikleri özetlemektedir.Çalışmanın ikinci bölümü, Türkçe sözcük türü işaretlemede belirsizlik gösteren -ad, sıfat, belirteç ve ilgeç- sözcük türlerini betimlemektedir.Çalışmanın üçüncü bölümü, tez araştırması için dengeli ve temsil gücü yüksek 3 milyon sözcüklük derlemin tasarım ve yapımını ele alınmaktadır. Bu bölüm ayrıca sözcük türlerindeki belirsizlikleri gidermek amacıyla geleneksel dilbilgisi ve dil tipolojisi alan yazın taraması sonucu oluşturulan testleri içermektedir.Çalışmanın dördüncü bölümü, işlev ve sıklık dağılımı açısından veriyi iki kısımda inceler. İlk kısım, insan kaynaklı sözlükleri ve Türkçedeki temel renk terimlerini ad-sıfat ayrımını amaçlayarak incelemektedir. İkinci kısım, birincil ve ikincil ilgeçleri incelemektedir.Bu betimlemeler, Türkçe'de sözcük türü işaretleme programlarına yol gösterici olabilecektir. Türkçe sözcük türü işaretlemede bu betimlemeler, işaretleme programları için kural niteliği taşıyabilir ya da belirsiz sözcükleri işaretlemede veri listesi hazırlamada kullanılabilir.Anahtar Sözcükler: Derlem, belirsiz sözcük türleri, Türkçe'de sözcük türü işaretleme | |
dc.description.abstract | This study gives a corpus-based description of the ambiguous word classes in Turkish in terms of their function and frequency distribution.The first section of the study summarises the word class categorisations, parts of speech tagging in Turkish and the ambiguities faced in Turkish, which attempts to give basic information for the literature.In the second section of the study, the word classes ? noun, adjectives, adverbs and postpositions ? causing ambiguity for part of speech tagging in Turkish are described.In the third section of the study, the design and building of a 3-million word corpus is explained, which provides a balanced and representive data for the research of the thesis. And the tests for disambiguation in word classes, which are compiled as a result of literature review in both in traditional and typological books, are stated.In the fourth section of the study, the data is analysed in terms of function and frequency distribution in two parts. The first part examines the human-related words and the basic colour terms in Turkish (noun-adjective distinction). The second part examines the primary and secondary postpositions.These descriptions would guide for the part of speech taggers in Turkish in terms of word classes. These may function as rules for part of speech taggers in tagging Turkish or be used in forming the input list in part of speech tagging ambiguous words.Key Words: Corpus, ambiguous word classes, part of speech tagging in Turkish | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Dilbilim | tr_TR |
dc.subject | Linguistics | en_US |
dc.subject | Türk Dili ve Edebiyatı | tr_TR |
dc.subject | Turkish Language and Literature | en_US |
dc.title | Tagging ambiguous word classes in Turkish | |
dc.title.alternative | Türkçede belirsiz sözcük türlerini işaretleme | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | İngiliz Dili ve Edebiyatı Anabilim Dalı | |
dc.subject.ytm | Corpus | |
dc.subject.ytm | Turkish | |
dc.subject.ytm | Grammar-word types | |
dc.subject.ytm | Marking | |
dc.subject.ytm | Corpus linguistics | |
dc.identifier.yokid | 422650 | |
dc.publisher.institute | Sosyal Bilimler Enstitüsü | |
dc.publisher.university | MERSİN ÜNİVERSİTESİ | |
dc.identifier.thesisid | 300525 | |
dc.description.pages | 294 | |
dc.publisher.discipline | Diğer |