Measuring the sentiment effects using emoticon features for a general Turkish corpus
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Metin içerisinde ifade edilen duyguların otomatik olarak bulunabilmesi, son zamanlarda başta mikro bloglar olmak üzere sosyal medya sitelerinin yükselişi ile önem kazanmış, gelecek vaat eden bir araştırma konusudur. Kullanıcılar tarafından üretilen metin sayısındaki artış; duygu analizinin tanımına farklı bir anlam kazandırmış, kullanıcı mesajlarından duyguları çıkarabilmek ise bu konu içerisindeki öncü yöntem olmuştur. Bu sebeple de fikir madenciliği, trendleri tahmin edebilmek için, grupların veya bireylerin sosyal davranışlarının analizi konusunda kritik bir çalışma konusu haline gelmiştir. Güncel uygulamalar içerisinde, emoji'ler fikirleri ifade edebilmek veya metin içerisindeki duyguları pekiştirebilmek için diller arası bir araç haline gelmiştir. Bununla birlikte emoji'lerin Türkçe metinlerdeki duyguların ayrıştırılabilmesi veya kesişmesi üzerindeki etkisini ölçen çalışma sayısı çok az olmuştur. Bu çalışmada, emoji'ler Türkçe metinler içerisindeki duyguları tanımlayabilme amacıyla kullanılmıştır. Duygu analizi, Destek Vektör Makineleri (DVK), kategorik Naïve Bayes (NB), FastText, Evrişimli Sinir Ağı (ESA) sınıflandırıcıları ile, eğitim ve test kümeleri Twitter mesajlarından elde edilen veri kümesi üzerinde gerçekleştirilmiştir. Veri kümesinin hazırlık ve işleme aşaması `duygu` ve `grup` isimli iki sınıflandırma şekli dikkate alınarak yapılmıştır. Ayrıca, jenerik sınıflandırma performansını ölçebilme amacıyla elle etiketlenen tweet'ler de değerlendirme işlemlerine dahil edilmiştir. Bağlam barındırmayan bir veri kümesinin kullanımı, farklı duyguların ölçülebildiği bir çalışma alanı olmaktadır. Automatic recognition of feelings in a text is a promising research area which has recently gained more importance with the rapid growth of social media websites, mostly microblogs. The increasing number of user generated text expands the definition of sentiment analysis where the extraction of emotions from user posts becomes a cutting edge. For that reason, the opinion mining becomes a crucial step for the analysis of social behavior in individuals or groups for the detection of trends. In current applications, the language of emojis is considered as a common way or an interlingua to express the ideas or intensify feelings. However, there are few studies to reveal its effects on Turkish context for overlapped and separate senses. In this study, emojis have been used as an identifier of the emotions in Turkish texts. The emotion analysis has been performed by Support Vector Machines (SVM), multinomial Naïve Bayes (NB), FastText and Convolutional Neural Network (CNN) using test and train sets derived from Twitter corpus. The preparation and preprocessing of the corpus have been accomplished by generating the classifiers; groups and emotions. The manually labeled tweets have also been added to evaluate the generic function of the classifier. The use of corpus in a generic domain present a promising field where different emotion states have been measured.
Collections