Tense, aspect and mood based event extraction for situation analysis and crisis management
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günümüzde olay çıkarımı sistemleri temel olarak görece az miktarda bir bilgiyi, durumların zaman ve kipsel niteliklerinden, öncelikle geçmiş zamanı niteleyen bildirimleri işlemektedir. Fakat zaman, görünüş ve kip eklerini inceleyebilensistemler daha iyi analizler sağlayabilir ve daha geniş uygulama alanı bulabilirler. Bu proje, Türkçe için bu tarz bir sistem geliştirmektedir. Bu sistem, Open Source Information Mining and Analysis (OPTIMA) araştırma grubunun olay çıkarımı yazılımlarına anlamsal gösterim formatı kapsamında gerekli eklemeler yapmıştır. Bu eklemeler, kısmi gramerlerin zaman, görünüş ve istek ekleri için uyarlanması, zarfların incelenmesi ve ExPRESS eşleme fonksiyonlarının geliştirilmesidir. Aynı zamanda,CORLEONE yazılımı standardında sözlük hazırlanmıştır. Bu iyileştirmeler, bütün dillerde uygulanabilecek, zaman, görünüş ve istek ilişkili kategoriler içeren bir anlamsal çerçeve olan çapa ilişkileri kuramına (Temürcü, 2007, 2011) göre yapılmıştır. Çalışmanın sonucunda geliştirilen sistem, basit olay yapısınınçıkarımına ek olarak, haber kaynaklarındaki cümleleri, zamansal, kipsel ve isteksel değerlerine göre sınıflandırır. Her ne kadar analiz Türkçe dilinde doğal afet, hastalık salgınları ve insan kaynaklı kaza haber raporlarına odaklansa da, bu yaklaşım diğerdillere, alanlara ve yazı türlerine uyarlanabilir. Bu olay çıkarımı ve sınıflandırma sistemi, ek geliştirmelerle, çevresel ve insani zararların engellenmesi için otomatik tarayıcı sistemlerin geliştirilmesini sağlayabilir. Nowadays event extraction systems mainly deal with a relatively small amount of information about temporal and modal qualifications of situations, primarily processing assertive sentences in the past tense. However, systems with a wider coverage of tense, aspect and mood can provide better analyses and can be used in a wider range of text analysis applications. This thesis develops such a system for Turkish language. This is accomplished by extending Open Source Information Mining and Analysis (OPTIMA) research group's event extraction software, by implementing appropriate extensions in the semantic representation format, by adding a partial grammar which improves the TAM (Tense, Aspect and Mood) marker, adverb analysis and matching functions of ExPRESS, and by constructing an appropriate lexicon in the standard of CORLEONE. These extensions are based on the theory of anchoring relations (Temürcü, 2007, 2011) which is a cross-linguistically applicable semantic framework for analyzing tense, aspect and mood related categories. The result is a system which can, in addition to extracting basic event structures, classify sentences given in news reports according to their temporal, modal and volitional/illocutionary values. Although the focus is on news reports of natural disasters, disease outbreaks and man-made disasters in Turkish language, the approach can be adapted to other languages, domains and genres. This event extraction and classification system, with further developments, can provide a basis for automated browsing systems for preventing environmental and humanitarian risk.
Collections