El yazması dokümanlarda üretken çekişmeli ağ tabanlı satır bölütlemesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Tarihi belgeler araştırmacıların ve tarihçilerin çalışmalarında kullandığı önemli referanslardır. Fakat bu belgelerin incelenerek doğru içerik ve bilgiye ulaşılması oldukça zahmetli bir iştir. Daha pratik ve hızlı bir araştırma için tarihi belgelerin dijitalleştirilmesi çok büyük bir öneme sahiptir ve bu amaçla günümüzde birçok tarihi doküman dijital ortama aktarılmaktadır. Dijital ortama aktarılan bu dokümanlardan doğru bilgiye ulaşmak kendi içinde birçok zorlukbarındırmaktadır. Matbu belgeler için satır bölütleme ve tanımlama işlemi oldukça başarılı hale gelmiştir. Fakat el yazması belgelerde bu başarının düştüğü görülmektedir. Özellikle tarihi belgelerde satır düzensizliği, belge hasarı, satır ve karakter örtüşmesi gibi problemler daha çok görülmektedir. Bu faktörler de satır bölütleme başarısını düşürmektedir.Bu tezde el yazması metinlerde satır bölütleme problemi için derin öğrenme tabanlı üretken çekişmeli ağlar üzerine çalışılmıştır. Bu amaçla geliştirilen üretken çekişmeli ağ tabanlı bölütleme yöntemi örtüşen satırların, farklı satırdavranışlarının yoğun olduğu Arapça veri setlerine uygulanmıştır. Elde edilen görsel ve sayısal sonuçlara göre üretken çekişmeli ağlar özellikle el yazması metinlerde temel bir problem olan satır bölütleme için başarılı bir performans sergilemiştir. Elde edilen sonuçlar diğer yöntemlerle de kıyaslanarak önerilen yöntemin üstünlükleri ve kısıtları tartışılmıştır. Historical documents are essential references that researchers and historians use in their studies. However, examining these documents and obtaining the right content and information is laborious. Therefore, digitization of historicaldocuments is of great importance for more practical and rapid research, and for this purpose, many historical documents are transferred to digital media today. However, accessing the correct information from these documents transferred tothe digital environment has many difficulties. Line segmentation and definition process for printed documents has becomequite successful. However, it is seen that this success has decreased in manuscript documents. Especially in historical documents, problems such as line irregularity, document damage, line and character overlap are more common. These factorsalso reduce the success of row segmentation. In this thesis, deep learning-based generative adversarial networks have beenstudied for the line segmentation problem in manuscripts. Furthermore, the generative contentious network-based segmentation method developed for this purpose has been applied to Arabic datasets where overlapping rows and different row behaviors are intense. According to the visual and numerical results obtained, productive contentious networks have performed successfully, especially line segmentation, which is a fundamental problem in manuscripts. Finally, the obtained results were compared with other methods, and the advantages and limitations of the proposed method were discussed.
Collections