Machine transliteration of Ottoman Turkish texts to modern Turkish
dc.contributor.advisor | Kurt, Atakan | |
dc.contributor.author | Bilgin, Esma Fatima | |
dc.date.accessioned | 2021-05-07T11:39:12Z | |
dc.date.available | 2021-05-07T11:39:12Z | |
dc.date.submitted | 2012 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/615855 | |
dc.description.abstract | Osmanlı Türkçesi 13.yy başından 20.yy'a kadar kullanılan Türkçenin yazı dildir. Osmanlı Türkçesi alfabesi 28 harfli Arap alfabesinin genişletilmiş bir çeşididir. Osmanlı Türkçesi ile yazılmış çok sayıda metin vardır. Bu metinlerin okunabilmesi için Latin alfabeli günümüz Türkçesi'ne aktarılması gerekir. Her iki yazı sistemi de aynı dil için kullanılmıştır yani kelimelerin telaffuzları her iki sistemde de aynıdır. Bu yüzden transliterasyon problemi Osmanlı Türkçesi ile yazılmış kelimelerin seslendirilmesi şeklinde düşünülebilir. Osmanlı Türkçesi transliterasyonunun temel problemi Osmanlı yazısında standart bir imlanın olmayışıdır. Problem karmaşık ve çok katmanlı olduğundan iki yazı sistemi arasında harf eşleştirmesi gibi basit bir çözüm yeterli değildir; DDİ tekniklerinin birlikte kullanılması gerekir. Bu çalışma Osmanlı Türkçesi metinlerin modern Türkçeye otomatik transliterasyonunu yapacak bir sistem geliştirilmesini hedeflemiştir. Bu çalışmanın katkıları (a) Osmanlı Türkçesi imlasının tarif edilmesi, (b) Osmanlı Türkçesi imlasındaki problemli noktaların, zorlukların, istisnaların ve ihtilafların tespit edilmesi, (c) transliterasyon için bir taslak oluşturarak halen geliştirilmesi devam eden otomatik transliterasyon sisteminin yapısının ortaya konması olarak sıralanabilir. | |
dc.description.abstract | The Ottoman script is a writing system of the Turkish language which was in use from the early the 13th century until the 20th century. Its alphabet is an extended version of the 28-letter Arabic alphabet. The transliteration of Ottoman script to Latin-based modern Turkish script is necessary in order to make a huge collection of text available to readers. Both scripts are used for the same language and the pronunciation of words remains the same. Thus, the transliteration problem can be reduced to pronunciation generation in Turkish for the Ottoman script. The main problem of the transliteration is the lack of a regular of orthography in the Ottoman script. The complexity of the problem requires a combination of NLP techniques beyond simple character mappings. This study is focused towards building a system for the automatic transcription of texts from Ottoman to modern Turkish script. Our contributions in this study are the followings: (a) to describe the Ottoman orthography for regular cases; (b) to report problems, difficulties, exceptions and variations in Ottoman orthography;(c) to give an outline of the transliteration framework, and present the architecture of an automatic transliteration system currently under development. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Machine transliteration of Ottoman Turkish texts to modern Turkish | |
dc.title.alternative | Osmanlı Türkçesi metinlerinin günümüz Türkçesi'ne otomatik aktarılması | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Bilgisayar Mühendisliği Ana Bilim Dalı | |
dc.subject.ytm | Ottoman | |
dc.subject.ytm | Turkish | |
dc.subject.ytm | Computer translation | |
dc.identifier.yokid | 440138 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | FATİH ÜNİVERSİTESİ | |
dc.identifier.thesisid | 318594 | |
dc.description.pages | 56 | |
dc.publisher.discipline | Diğer |