Investigating the performance of segmentation methods with deep learning models for sentiment analysis on Turkish informal texts
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışma morfolojik olarak zengin dillerde kısa informal metinlerde etkili bir şekilde duygu analizi yapılmasını incelemektedir. Bu tezde önerilen çalışmanın temel yapı taşlarını metin segmentasyonu ve yapay sinir ağı modeli yaratılması oluşturmaktadır. Segmentasyon farklı metodolojilerle metinlerin ön-işlemden geçirilmesini sağlar. Bu çalışmada kullanılan metodolojiler dört farklı ana groupta kümelenmiştir. Bunlar, morfolojik, kelime-altı sözcük, dizgeleme ve hibrit metodlarından oluşmaktadır. Çoğunlukla bu ana grupların altında birden fazla farklı metod kullanılmıştır. İkinci aşama metinlerin sınıflandırılması için etkili model yaratmaya odaklanmadtadır. İlk aşamada oluşturulan herbir segmentasyon yöntemi için Konvolüsyonel Sinir Ağı (KSA ya da CNN) ve Tekrarlayan Sinir Ağı (TSA ya da RNN) modellerinin litaratürde iyi bilinen parametreleri kullanılarak performans testleri yapılmaktadır. This work investigates segmentation approaches for informal short texts in morphologically rich languages in order to effectively classify the sentiment. The two building blocks of the proposed work in this thesis are segmentation and deep neural network model building. Segmentation focuses on preprocessing of text with different methodologies. These methodologies are grouped under four distinct approaches; namely, morphological, sub-word, tokenization, and hybrid approaches. There is mostly multiple numbers of variants for each of these four methods provided in this work. The second stage focuses on effective model building for classifying text. Performances of each method are evaluated by utilizing a model built by a Convolutional Neural Network (CNN) and Recurrent Neural Network (RNN) model proposed in the literature for text classification.
Collections