Show simple item record

dc.contributor.advisorAtalay, Mehmet Volkan
dc.contributor.authorKorkmaz, Sait Ulaş
dc.date.accessioned2020-12-10T11:07:13Z
dc.date.available2020-12-10T11:07:13Z
dc.date.submitted2002
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/255742
dc.description.abstractoz TÜRKÇE OPTİK KARAKTER TANIMA İÇİN BAGLAMSAL SON İŞLEME Korkmaz, Sait Ulaş Yüksek Lisans Tezi, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Assoc. Prof. Dr. Volkan Atalay Eylül 2002, 74 sayfa Bu çalışmada Türkçe basılı harfler için geliştirilen bir optik karakter tanıma sistemi için bağlamsal son işleme alt sistemi sunulmuştur. Bağlamsal son işleme alt sistemi Türkçe pozisyona bağlı ikili 3 -gram istatistikleri, bir hata düzeltici ayrıştırıcı ve Türkçe'deki kök kelimeleri ve bunların çekimli hallerini içeren bir sözlük üzerine kurulmuştur. N-gram istatistikleri optik karakter tanıyıcının tanıdığı aday kelimeler için oluşturulan benzerlik kümelerindeki elemanları elemekte kullanılır. Sözlük ise aday kelimelere 2 veya daha az karakter düzenleme uzaklıktaki kelimeleri aramak için kullanılır. Hata düzeltici ayrıştırıcı ise Türkçe biçim bilimini kullanarak optik karakter tanıyıcının adayları arasında kökünü doğru tanıdığı kelimeleri düzeltmek için kullanılır. ivAnahtar Sözcükler: Optik Karakter Tanıma, Sözlük İçinde Arama, Bağlamsal Son İşleme, N-gram İstatistikleri, Hata Düzeltici Ayrıştırıcı, Türkçe Morfoloji.
dc.description.abstractABSTRACT CONTEXTUAL POST PROCESSING FOR TURKISH CHARACTER RECOGNITION Korkmaz, Sait Ulaş M.Sc, Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Volkan Atalay September 2002, 74 pages This thesis presents a contextual post processing subsystem for a Turkish machine printed optical character recognition system. The contextual post processing subsystem is based on positional binary 3 -gram statistics for Turkish language, an error corrector parser and a lexicon, which contains root words and the inflected forms of the root words. Positional binary 3-gram statistics is used to eliminate the elements of the similarity sets built for optical character recognition (OCR) results. The lexicon is used for searching for alternatives that have 2 or less edit string distance to OCR candidates. Error corrector parser is used for correcting OCR alternatives using Turkish Morphology. Keywords: Optical Character Recognition, Lexicon Search, Contextual Post Processing, N-gram Statistics, Error Correcting Parser, Turkish Morphology. in > C. YÜKSEK ;<U7`. 7λ-en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/embargoedAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleContextual post processing for Turkish optical character recognition
dc.title.alternativeTürkçe optik karakter tanıma için bağlamsal son işleme
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentDiğer
dc.subject.ytmError correction
dc.subject.ytmMorphology
dc.subject.ytmTurkish
dc.subject.ytmCharacter recognition
dc.subject.ytmPostprocessors
dc.identifier.yokid127167
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityORTA DOĞU TEKNİK ÜNİVERSİTESİ
dc.identifier.thesisid119244
dc.description.pages74
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/embargoedAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/embargoedAccess