Sosyal medyada duygu analizi ve nitelik çıkarımı
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Günümüzde artan sosyal medya kullanımı, bu alandaki veriler üzerinden analiz ihtiyacını doğurmuştur. Bu çalışmada sosyal medya verilerinin duygu analizi yapılarak sınıflandırılmasını ve bu sınıflanmanın altında yatan gerçek nedenin ne olduğunun ortaya çıkarılması ve niteliklerin belirlenmesi amaçlanmıştır. Bu işlem gerçekleştirilirken sosyal medyadaki verilerin genellikle imla kurallarından yoksun olması, çalışmada kullanılan verilerin bir ön işlem yardımıyla düzeltilmesi gerekliliğini de ortaya çıkarmıştır. Çalışma ışığında veriler olumlu ve olumsuz olmak üzere iki sınıfa ayrılmış, bu gruplar üzerinden de kişilerin yaptığı paylaşımların hangi noktaya doğru yoğunlaştığı, bu yoğunlaşmanın hangi unsuru nitelendirdiği bulunmaya çalışılmıştır. Duygu analizi yapılırken öncelikle veriler ön işlemden geçirilmiş ve metinler düzetilmiş, daha sonra makine öğrenmesi teknikleri kullanılarak analiz gerçekleştirilmiştir. Niteliklerin çıkarılması için terim varlığı, frekans analizi ve kelimelerin yapısal olarak incelenmesiyle bir çıkarım elde edilmiştir. The increasing use of social media nowadays has led to the need for analysis on the data in these platforms. In this thesis, we aimed to classify the data by sentiments and clarify real reasons of this classification, by doing this study we assumed that the real attibutes of this classification can be understood. While processing the data, the need to preprocess and correct the data has risen due to the unstructured and ungrammatical text on social media. In the light of this study the data is splitted into two groups, which are positive and negative, then the direction of users' shares and entries are investigated and attribute based condensation of data is tried to be clarified. While analyzing sentiments firstly the data has been preprocessed and spellings has been corrected, then analysis has been done by using machine learning techniques. The result has been taken by using presence of terms, frequency analysis and structure analysis of data.
Collections