Show simple item record

dc.contributor.advisorKurt, Atakan
dc.contributor.authorBilgin, Esma Fatima
dc.date.accessioned2021-05-07T11:39:12Z
dc.date.available2021-05-07T11:39:12Z
dc.date.submitted2012
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/615855
dc.description.abstractOsmanlı Türkçesi 13.yy başından 20.yy'a kadar kullanılan Türkçenin yazı dildir. Osmanlı Türkçesi alfabesi 28 harfli Arap alfabesinin genişletilmiş bir çeşididir. Osmanlı Türkçesi ile yazılmış çok sayıda metin vardır. Bu metinlerin okunabilmesi için Latin alfabeli günümüz Türkçesi'ne aktarılması gerekir. Her iki yazı sistemi de aynı dil için kullanılmıştır yani kelimelerin telaffuzları her iki sistemde de aynıdır. Bu yüzden transliterasyon problemi Osmanlı Türkçesi ile yazılmış kelimelerin seslendirilmesi şeklinde düşünülebilir. Osmanlı Türkçesi transliterasyonunun temel problemi Osmanlı yazısında standart bir imlanın olmayışıdır. Problem karmaşık ve çok katmanlı olduğundan iki yazı sistemi arasında harf eşleştirmesi gibi basit bir çözüm yeterli değildir; DDİ tekniklerinin birlikte kullanılması gerekir. Bu çalışma Osmanlı Türkçesi metinlerin modern Türkçeye otomatik transliterasyonunu yapacak bir sistem geliştirilmesini hedeflemiştir. Bu çalışmanın katkıları (a) Osmanlı Türkçesi imlasının tarif edilmesi, (b) Osmanlı Türkçesi imlasındaki problemli noktaların, zorlukların, istisnaların ve ihtilafların tespit edilmesi, (c) transliterasyon için bir taslak oluşturarak halen geliştirilmesi devam eden otomatik transliterasyon sisteminin yapısının ortaya konması olarak sıralanabilir.
dc.description.abstractThe Ottoman script is a writing system of the Turkish language which was in use from the early the 13th century until the 20th century. Its alphabet is an extended version of the 28-letter Arabic alphabet. The transliteration of Ottoman script to Latin-based modern Turkish script is necessary in order to make a huge collection of text available to readers. Both scripts are used for the same language and the pronunciation of words remains the same. Thus, the transliteration problem can be reduced to pronunciation generation in Turkish for the Ottoman script. The main problem of the transliteration is the lack of a regular of orthography in the Ottoman script. The complexity of the problem requires a combination of NLP techniques beyond simple character mappings. This study is focused towards building a system for the automatic transcription of texts from Ottoman to modern Turkish script. Our contributions in this study are the followings: (a) to describe the Ottoman orthography for regular cases; (b) to report problems, difficulties, exceptions and variations in Ottoman orthography;(c) to give an outline of the transliteration framework, and present the architecture of an automatic transliteration system currently under development.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleMachine transliteration of Ottoman Turkish texts to modern Turkish
dc.title.alternativeOsmanlı Türkçesi metinlerinin günümüz Türkçesi'ne otomatik aktarılması
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentBilgisayar Mühendisliği Ana Bilim Dalı
dc.subject.ytmOttoman
dc.subject.ytmTurkish
dc.subject.ytmComputer translation
dc.identifier.yokid440138
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityFATİH ÜNİVERSİTESİ
dc.identifier.thesisid318594
dc.description.pages56
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess