Conflict analysis for Turkish debates using text mining and text segmentation techniques
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Uyuşmazlık Analizi birçok kurum ve devlet için önemli bir konu olmasının yanı sıra bunu çok iyi bir şekilde yapma ihtiyacı içerisindedirler. Bir problemin çözümünde doğru analizin önemi bunda büyük rol oynamaktadır. Bu sebeple bu tez çalışması bir bilgisayar yazılımının bir tartışmadaki sebeplerin tespiti üzerine odaklanmıştır. Bu çalışmadaki tartışma diyalogları Türkçe'den seçilmiştir, çünkü bu dilde bu konu özelinde yeterince çalışma yoktur. Dahası, buradaki çalışma yöntemi diğer dillere de uygulanabilirdir. Çünkü bu çalışma için bir duygu sözlüğü kullanılmıştır ve duygular hemen her dilde aynıdır. Faydalanılan duygu sözlüğü daha önce hazırlanmış olan SentiWordNet'den alınmıştır. Bu sözlük İngilizce özelinde yapılmıştır. Bu çalışma özelinde ise Türkçe'ye çevrilmiştir. Bununla birlikte, makine öğrenmesi ve sözlük tabanlı yaklaşımlar ile sonuçların çeşitliliği arttırılmaya çalışılmıştır. Bu çalışmanın amacı dillerin teknik yollar ile analiz edilebileceğini ve dolayısı ile tartışmaların sebeplerinin bulunabileceğini göstermektir. Aynı şekilde, bu çalışmanın ana katkılarından biri de Türkçe tartışmalardaki uyuşmazlık analizi için uygulanan buradaki tekniklerin diğer diller için de uygulanabilir olacağıdır. Conflict Analysis is one of the most challenging issues in the world that many organizations and governments try to carry out perfectly. It is crucial to have a correct analysis to prepare a resolution for a problem. Thus, this thesis paper focuses on the ways that a software program can detect the reasons of arguments in a debate. The examples of debate dialogs are chosen from Turkish language because there is not much research in this area with this language. Moreover, the techniques which are applied in this work can also be applied to other languages, because a sentiment word dictionary is used and sentiments are almost the same in every language. This is a prepared dictionary from SentiWordNet with all the sentiment points for English words. It is translated and extended for the Turkish language. Furthermore, both machine learning and lexicon-based approaches are implemented in order to increase the diversity of results. This paper aims to show that languages can be processed in a technical manner and meanings can be extracted from sentences to understand the reasons of arguments. Likewise, the main contribution of this thesis is that conflict analysis for Turkish debates can be applied with the techniques which are examined here and they are also suitable for other languages.
Collections