A deep learning approach to sentiment analysis in Turkish
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Duygusal analiz makine öğrenmesinin alt dallarından biri olan doğal dil işlemenin problemlerinden biridir. Çoğunlukla sosyal medya paylaşımlarının, ürün ve medya yorumlarının kutupluluğunu belirlemek için kullanılır. Veri bilimcileri ve sosyal medya analistlerinin bu konuya olan ilgilerinden ötürü doğal dil işlemenin en popüler konuları arasındadır. İyi bir duygu analizi ölçer elde etmek için veri sözlüğü bazlı yöntemlerin yanı sıra, çokça bilinen tekniklerden ileri düzey algoritmalara varıncaya kadar farklı türlerde uygulamalar geliştirilmiştir. Bu çalışma, Türkçe'de duygu analizini için öğrenme metodlarını önerir. Mantıksal regresyon ve Naïve Bayes sınıflandırıcılar gibi geleneksel makine öğrenme metodları bu problemin çözümü için kullanılmaktadır. Fakat kelime kümeleri (bag-of-words) modellerini kullanan ve kelimelerin cümle içerisindeki yerini gözardı eden bu metodların uygulanabilirliği sınırlıdır. Bu çalışmada, bu bilinen yaklaşımları modern teknikler olarak sayabileceğimiz LSTM gibi Özyinelemeli Sinir Ağlarıyla, filmler hakkında bilgiler içeren popüler bir Türkçe web sitesinden elde ettiğimiz veriseti üzerinde uygulamalar yaparak karşılaştırıyoruz. Sonuçlarımız Özyinelemeli Sinir Ağları'nı kullanan yöntemlerin sınıflandırma sonuçlarında gelişme gösterdiği yönündedir. Sentiment analysis is an application of natural language processing (NLP) which is a subfield of artificial intelligence. Sentiment analysis is used to determine the polarity of the thoughts mostly on social media posts, product or different media reviews. Due to its growing demand by data scientists and social media analysts it is one of the most popular topics in NLP. Beside the lexicon-based techniques, from well-known machine learning techniques to advanced algorithms such as deep learning algorithms, there are different kind of algorithms and approaches developed to obtain a good sentiment analysis tool. This study proposes using recurrent neural networks, a type of deep learning algorithm for sentiment analysis in Turkish. Traditional machine learning methods such as logistic regression or Naive Bayes are often applied to this problem however their applicability is limited since they use bag-of-words model which does not take into account the order of the words in a sentence. In this study we compare these approaches with a modern technique called recurrent neural networks using LSTM units on a dataset crawled from a Turkish movie website. Our results show that RNN based approaches improve the classification accuracies.
Collections