A deep learning based translation system from Ottoman Turkish to Modern Turkish
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Diller zamanla değişim ve gelişime uğrar. Sonuç olarak eski metinler günümüz nesil için anlaşılmaz hale gelebilir. Osmanlı Türkçe'sinin yazıları bir örnektir. Modern Türkçe'de alfabenin değişmesiyle birlikte, bazı gramer yapıları, eski kelimeler ve ifadeler artık aktif olarak kullanılmamaktadır. Ayrıca, eski belgelerin bugünkü dilde yeniden yazılması, eski ve yeni dile olabildiğince hakim yazarlar gerektirir. Ancak böyle kişilerin bulunması zaman ve kaynak açısında maliyetlidir. Bu problemin önemine rağmen az sayıda araştırmacı bu konuda çalışmıştır. Çalışmaları, çoğunlukla eski metinleri Arap alfabesinden Latin alfabesine çevirmek için kural tabanlı sistemler oluşturmaya odaklanır. Bu gerekli olsa da, daha fazla çalışma yapılması gerekmektedir.Bu tez, Sinirsel Makine Çevirisi tekniklerini kullanarak Osmanlı Türkçesini modern Türkçeye çevirme ve tercüme etme problemini ele alıyor. Katkılarımız üç bölümden oluşmaktadır. •Osmanlı Türkçe'sinden Latin karakterleri ile yazılmış eski Türkçe'ye, Latin karakterleri ile yazılmış eski Türkçe'den modern Türkçe'ye ve Osmanlı Türkçe'sinden modern Türkçe'ye üç paralel korpusu geliştiriyoruz,•Osmanlı Türkçe'sinden eski Türkçe'ye paralel korpusu geliştirmek için aksi yönde yani eski Türkçe'den Osmanlı Türkçe'sine bir biçimbilim tabanlı çeviri aracı yeniden gerçekleştiriyoruz, ve•Ana katkımız olarak bahsi geçen üç paralel korpusu kullanarak sinirsel uçtan uca çeviri sistemi geliştiriyoruz. Languages develop and change over time. Consequently, old texts may become unintelligible for today's generation. Ottoman Turkish writings are an example. In modern Turkish, the alphabet has changed, some grammatical structures are no longer in use, and some foreign words and phrases are not actively employed anymore. Moreover, rewriting old documents in today's language requires qualified writers, who are responsible for the translation. Unfortunately, that is costly in both time and resources. Despite the importance of this problem, few researchers have worked on it. Their solutions, mainly, focus on building rule-based-systems to transliterate old texts from the Arabic alphabet to the Latin alphabet. While that is essential, further work needs to be done.This thesis approaches the problem of translating and transliterating Ottoman Turkish to modern Turkish using Neural Machine Translation techniques. Our contributions are on three folds.•We develop three parallel corpora; the first one from Ottoman Turkish to old Turkish written with Latin characters, the second one from old Turkish written with Latin characters to modern Turkish and the third one from Ottoman Turkish to modern Turkish,•For the development of Ottoman Turkish to old Turkish parallel corpus, we re-implement a morphology-based transliteration tool in the other way around; from old Turkish to Ottoman Turkish, and•As our main contribution, we develop three neural-based end-to-end translation systems using the three parallel corpora mentioned.
Collections