Türkçe metinlerin kavram haritalarının otomatik olarak oluşturulması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Amaç: Kavram haritaları belirli bir konuya ait kavramlar arasındaki ilişkileri tanımlayan iki boyutlu görsel araçlardır. Bu haritaların manuel olarak oluşturulması özellikle metin yoğunluğu fazla olan metinler açısından ilgili alanda uzmanlık gerektirmek, görsel karmaşıklığı minimuma indirmek ve haritaları bütünleştirmek gibi sorunları beraberinde getirmektedir. Bu sorunların üstesinden gelmek amacıyla kavram haritalarının otomatik olarak oluşturulmasına yönelik çalışmalara ihtiyaç duyulmaktadır. Öte yandan bir belgeden tam otomatik ve insan eli kalitesinde havram haritası üretimi henüz tatmin edici bir şekilde gerçekleştirilememiştir. Bu bilgiler ışığında bu çalışmanın amacı Türkçe metin belgelerinden kavram haritalarının otomatik olarak oluşturulmasını sağlamaktır. Yöntem: Bu tez kapsamında Türkçe metinlerden kavram haritalarının otomatik olarak çıkarılması için Türkçe Doğal Dil İşleme yazılım zincirinden ve Graphviz aracından yararlanan bir sezgisel algoritma geliştirilmiştir. Söz konusu algoritma Türkçe kelimelerin cümle içinde birbirlerine olan bağımlılıklarından yola çıkarak kavramların elde edilmesi prensibiyleçalışmaktadır. Algoritma ayrıca yeni bir cümle puanlandırma mekanizması ile kavram haritasına eklenecek olan cümleleri belirlemektedir.Bulgular: Geliştirilen algoritma Türkçe, Coğrafya, Fen Bilimleri ve Bilgisayar Bilimleri alanlarında toplam 20 veri seti üzerinde uygulanmıştır. Algoritmanın yetkinliği performans değerlendirme ölçütlerinden olan kesinlik, duyarlılık ve F-ölçütü ile analiz edilmiştir. Önerilen algoritmanın Türkçe kavramlar içeren metinlerde oldukça etkili olduğu görülmüştür. Kavram haritasına eklenecek olan cümle seçimi algoritmasının performans ölçütleri açısından ortalama değere yakın sonuç ürettiği gözlemlenmiştir.Sonuç: Önerilen algoritma ile elde edilen kavram haritalarının manuel olarak çıkarılan kavram haritalarına oldukça benzediği anlaşılmıştır. Geliştirilen algoritmanın bir doğal dil işleme aracına bağımlı olduğu ve bu nedenle bazı durumlarda manuel müdahale gerektirdiği tespit edilmiştir.Anahtar Kelimeler: kavram haritası, kavram haritası madenciliği, doğal dil işleme, Türkçe metin analizi Purpose: Concept maps are two-dimensional visual tools that describe the relationships between concepts belonging to a particular subject. The manual creation of these maps entails problems such as requiring expertise in the relevant field, minimizing visual complexity, and integrating maps, especially in terms of text-intensive documents. In order to overcome these problems, automatic creation of concept maps is required. On the other hand, the production of a fully automated and human-hand quality concept map from a document has not yet been achieved satisfactorily. In the light of this information, the aim of this study is to provide automatic creation of the concept maps from Turkish text documents.Method: Within the scope of this thesis, a heuristic algorithm has been developed using the Turkish Natural Language Processing software chain and the Graphviz tool to automatically extract concept maps from Turkish texts. The proposed algorithm works with the principle of obtaining concepts based on the dependencies of Turkish words in sentences. The algorithm also determines the sentences to be added to the concept map with a new sentence scoring mechanism.Findings: The developed algorithm has been applied on a total of 20 data sets in the fields of Turkish, Geography, Science and Computer Sciences. The effectiveness of the algorithm has been analyzed with three different performance evaluation criteria, namely precision, recall and F-score. The findings have revealed that the proposed algorithm is quite effective in texts containing Turkish concepts. It has also been observed that the sentence selection algorithmproduces results close to the average value in terms of performance criteria.Results: According to the findings, the concept maps automatically obtained by the proposed algorithm are quite similar to the concept maps extracted manually. On the other hand, there is a limitation of the developed algorithm since it is dependent on a natural language processing tool and therefore requires manual intervention in some cases.Keywords: concept map, concept map mining, natural language processing, Turkish text analysis
Collections