Sentiment analysis for Turkish Language
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Duygu yada düşünce analizi metinlerden kişisel değerlendirmelerin çıkarımını sağlayan doğaldil işleme branşıdır. Duygu analizinin ilgi alanına giren değerlendirmelere örnek olarak tüketiciyorumları, film değerlendirmeleri, borsa tahminleri ve siyasi araştırmalar gibi geniş ölçekteörnekler verilebilir.Son yıllarda web 2.0 ve sosyal medyanın artış hızına bağlı olarak öznel değerlendirmeler müthişderecede arttı. Her gün insanlar petabaytlarca veri girişi yapıyor. Bu boyuttaki ham verininanalizi gerek bireyler gerekse de şirketler için gittikçe daha fazla önem arz etmeye başladı.İngilizce için birçok duygu analizi çalışmaları mevcut. Ancak bu çalışma alanı Türkçe için halabakir. Gerçekleştirilen tek çalışma tek bir alan üzerine yoğunlaşıp tek tipte veri üzerinde tek tipmakina öğrenmesi algoritması kullanmış.Bu tez kapsamında farklı alanlara ait yeni veri grupları oluşturulmuş, Türkçe'ye özel verihazırlama algoritması tanıtılmış ve oluşturulan veri üzerinde farklı makina öğrenmesialgoritmaları uygulanmıştır. Naïve Bayes sınıflandırıcı kullanılarak başarılı sayılabilecek%85'lik doğruluk oranı yakalanmıştır. Sentiment analysis a.k.a. opinion mining is an application of natural language processing toextract subjective information from given texts. Consumer comments, evaluation of films, stockexchange predictions and political researches are some examples of subjective declarations thatsentiment analysis involves.Subjective data have hugely increased parallel to web 2.0 and social media growth in recentyears. People generate petabytes of data every day. Processing of this amount of raw databecame more and more important for both companies and individuals.Many sentiment analysis studies conducted in the past are focused on English Language only.Therefore, for Turkish Language, sentiment analysis is a blue ocean yet. There is a single studyfocused on only one input domain and tested with only one machine learning algorithm.Within the focus of this thesis new datasets were constructed in various domains, a Turkishspecific input preparation algorithm was introduced, and different machine learning algorithmswere applied over prepared data. ~85% accuracy was achieved with Naïve Bayes Classifier.
Collections