Ontology based information extraction on free text radiological reports using natural language processing approach
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tez, serbest metin Türkçe radyoloji raporlarını işleyerek, var olan bilgiyi çıkartıp, yapılandırılmış bilgi modeline dönüştüren bir bilgi çıkarım sistemini tanımlar. Sistem, doğal dil işleme tekniklerini, bir alan ontolojisi ile birlikte kullanarak, sözel olarak yapılmış tanımlamaları hedef bilgi modeline çevirir ve böylece bilgi, bilgisayar tarafından işlenebilir hale getirilmiş olur. Geliştirilen alan ontolojisi, bilgi çıkarımı sırasında, varlık tanımlama ve ilişki çıkarılması aşamalarında etkili olarak kullanılmıştır. Ontoloji, çıkarım kurallarının tasarımında esneklik sağlar. Ontolojinin yapısı, çıkarılan semantik bilginin yapısın da tanımlayan bilgi modelini belirler. Ek olarak, ontoloji cümlelerde yer alması gereken, ancak, bilindiği var sayıldığı için ifade edilmeyen varlıkların saptanmasını sağlar. Bu tezin temel katkılarından biri, ontolojinin bilgi çıkarım kuralları içerisinde kullanılarak ifade gücünü artırması ve cümlelerdeki kayıp varlıkların saptanmasını sağlamasıdır. Sistem Türkçe metinler için geliştirilen ilk bilgi çıkarım sistemidir. Türkçe, morfolojik olarak zengin bir dil olduğu için, sistem bir morfolojik analizör kullanır ve çıkarım kuralları da bu morfolojik özelliklerden faydalanır. Sistem, performans değerlendirmesinde, %93 geri çağırma ve %98 duyarlık değerlerine ulaşmıştır. This thesis describes an information extraction system that is designed to process free text Turkish radiology reports in order to extract and convert the available information into a structured information model. The system uses natural language processing techniques together with domain ontology in order to transform the verbal descriptions into a target information model, so that they can be used for computational purposes. The developed domain ontology is effectively used in entity recognition and relation extraction phases of the information extraction task. The ontology provides the flexibility in the design of extraction rules, and the structure of the ontology also determines the information model that describes the structure of the extracted semantic information. In addition, some of the missing terms in the sentences are identified with the help of the ontology. One of the main contributions of this thesis is the usage of ontology in information extraction that increases the expressive power of extraction rules and helps to determine missing items in the sentences. The system is the first information extraction system for Turkish texts. Since Turkish is a morphologically rich language, the system uses a morphological analyzer and the extraction rules are also based on the morphological features. TRIES achieved 93% recall and 98% precision results in the performance evaluations.
Collections