Contextual post processing for Turkish optical character recognition

Korkmaz, Sait Ulaş

dc.contributor.advisor	Atalay, Mehmet Volkan
dc.contributor.author	Korkmaz, Sait Ulaş
dc.date.accessioned	2020-12-10T11:07:13Z
dc.date.available	2020-12-10T11:07:13Z
dc.date.submitted	2002
dc.date.issued	2018-08-06
dc.identifier.uri	https://acikbilim.yok.gov.tr/handle/20.500.12812/255742
dc.description.abstract	oz TÜRKÇE OPTİK KARAKTER TANIMA İÇİN BAGLAMSAL SON İŞLEME Korkmaz, Sait Ulaş Yüksek Lisans Tezi, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Assoc. Prof. Dr. Volkan Atalay Eylül 2002, 74 sayfa Bu çalışmada Türkçe basılı harfler için geliştirilen bir optik karakter tanıma sistemi için bağlamsal son işleme alt sistemi sunulmuştur. Bağlamsal son işleme alt sistemi Türkçe pozisyona bağlı ikili 3 -gram istatistikleri, bir hata düzeltici ayrıştırıcı ve Türkçe'deki kök kelimeleri ve bunların çekimli hallerini içeren bir sözlük üzerine kurulmuştur. N-gram istatistikleri optik karakter tanıyıcının tanıdığı aday kelimeler için oluşturulan benzerlik kümelerindeki elemanları elemekte kullanılır. Sözlük ise aday kelimelere 2 veya daha az karakter düzenleme uzaklıktaki kelimeleri aramak için kullanılır. Hata düzeltici ayrıştırıcı ise Türkçe biçim bilimini kullanarak optik karakter tanıyıcının adayları arasında kökünü doğru tanıdığı kelimeleri düzeltmek için kullanılır. ivAnahtar Sözcükler: Optik Karakter Tanıma, Sözlük İçinde Arama, Bağlamsal Son İşleme, N-gram İstatistikleri, Hata Düzeltici Ayrıştırıcı, Türkçe Morfoloji.
dc.description.abstract	ABSTRACT CONTEXTUAL POST PROCESSING FOR TURKISH CHARACTER RECOGNITION Korkmaz, Sait Ulaş M.Sc, Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Volkan Atalay September 2002, 74 pages This thesis presents a contextual post processing subsystem for a Turkish machine printed optical character recognition system. The contextual post processing subsystem is based on positional binary 3 -gram statistics for Turkish language, an error corrector parser and a lexicon, which contains root words and the inflected forms of the root words. Positional binary 3-gram statistics is used to eliminate the elements of the similarity sets built for optical character recognition (OCR) results. The lexicon is used for searching for alternatives that have 2 or less edit string distance to OCR candidates. Error corrector parser is used for correcting OCR alternatives using Turkish Morphology. Keywords: Optical Character Recognition, Lexicon Search, Contextual Post Processing, N-gram Statistics, Error Correcting Parser, Turkish Morphology. in > C. YÜKSEK ;<U7`. 7Î»-	en_US
dc.language	English
dc.language.iso	en
dc.rights	info:eu-repo/semantics/embargoedAccess
dc.rights	Attribution 4.0 United States	tr_TR
dc.rights.uri	https://creativecommons.org/licenses/by/4.0/
dc.subject	Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol	tr_TR
dc.subject	Computer Engineering and Computer Science and Control	en_US
dc.title	Contextual post processing for Turkish optical character recognition
dc.title.alternative	Türkçe optik karakter tanıma için bağlamsal son işleme
dc.type	masterThesis
dc.date.updated	2018-08-06
dc.contributor.department	Diğer
dc.subject.ytm	Error correction
dc.subject.ytm	Morphology
dc.subject.ytm	Turkish
dc.subject.ytm	Character recognition
dc.subject.ytm	Postprocessors
dc.identifier.yokid	127167
dc.publisher.institute	Fen Bilimleri Enstitüsü
dc.publisher.university	ORTA DOĞU TEKNİK ÜNİVERSİTESİ
dc.identifier.thesisid	119244
dc.description.pages	74
dc.publisher.discipline	Diğer

Files in this item

Name:: yokAcikBilim_127167.pdf
Size:: 2.479Mb
Format:: PDF
Description:: File_127167

View/Open

This item appears in the following Collection(s)

TEZLER

Show simple item record

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/embargoedAccess