Contextual post processing for Turkish optical character recognition
dc.contributor.advisor | Atalay, Mehmet Volkan | |
dc.contributor.author | Korkmaz, Sait Ulaş | |
dc.date.accessioned | 2020-12-10T11:07:13Z | |
dc.date.available | 2020-12-10T11:07:13Z | |
dc.date.submitted | 2002 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/255742 | |
dc.description.abstract | oz TÜRKÇE OPTİK KARAKTER TANIMA İÇİN BAGLAMSAL SON İŞLEME Korkmaz, Sait Ulaş Yüksek Lisans Tezi, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Assoc. Prof. Dr. Volkan Atalay Eylül 2002, 74 sayfa Bu çalışmada Türkçe basılı harfler için geliştirilen bir optik karakter tanıma sistemi için bağlamsal son işleme alt sistemi sunulmuştur. Bağlamsal son işleme alt sistemi Türkçe pozisyona bağlı ikili 3 -gram istatistikleri, bir hata düzeltici ayrıştırıcı ve Türkçe'deki kök kelimeleri ve bunların çekimli hallerini içeren bir sözlük üzerine kurulmuştur. N-gram istatistikleri optik karakter tanıyıcının tanıdığı aday kelimeler için oluşturulan benzerlik kümelerindeki elemanları elemekte kullanılır. Sözlük ise aday kelimelere 2 veya daha az karakter düzenleme uzaklıktaki kelimeleri aramak için kullanılır. Hata düzeltici ayrıştırıcı ise Türkçe biçim bilimini kullanarak optik karakter tanıyıcının adayları arasında kökünü doğru tanıdığı kelimeleri düzeltmek için kullanılır. ivAnahtar Sözcükler: Optik Karakter Tanıma, Sözlük İçinde Arama, Bağlamsal Son İşleme, N-gram İstatistikleri, Hata Düzeltici Ayrıştırıcı, Türkçe Morfoloji. | |
dc.description.abstract | ABSTRACT CONTEXTUAL POST PROCESSING FOR TURKISH CHARACTER RECOGNITION Korkmaz, Sait Ulaş M.Sc, Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Volkan Atalay September 2002, 74 pages This thesis presents a contextual post processing subsystem for a Turkish machine printed optical character recognition system. The contextual post processing subsystem is based on positional binary 3 -gram statistics for Turkish language, an error corrector parser and a lexicon, which contains root words and the inflected forms of the root words. Positional binary 3-gram statistics is used to eliminate the elements of the similarity sets built for optical character recognition (OCR) results. The lexicon is used for searching for alternatives that have 2 or less edit string distance to OCR candidates. Error corrector parser is used for correcting OCR alternatives using Turkish Morphology. Keywords: Optical Character Recognition, Lexicon Search, Contextual Post Processing, N-gram Statistics, Error Correcting Parser, Turkish Morphology. in > C. YÜKSEK ;<U7`. 7λ- | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/embargoedAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Contextual post processing for Turkish optical character recognition | |
dc.title.alternative | Türkçe optik karakter tanıma için bağlamsal son işleme | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Diğer | |
dc.subject.ytm | Error correction | |
dc.subject.ytm | Morphology | |
dc.subject.ytm | Turkish | |
dc.subject.ytm | Character recognition | |
dc.subject.ytm | Postprocessors | |
dc.identifier.yokid | 127167 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | ORTA DOĞU TEKNİK ÜNİVERSİTESİ | |
dc.identifier.thesisid | 119244 | |
dc.description.pages | 74 | |
dc.publisher.discipline | Diğer |