Doğal dil işleme yöntemleriyle Türkçe sosyal medya verileri üzerinde duygu analizi
dc.contributor.advisor | Zontul, Metin | |
dc.contributor.author | Yelmen, İlkay | |
dc.date.accessioned | 2021-05-08T06:41:35Z | |
dc.date.available | 2021-05-08T06:41:35Z | |
dc.date.submitted | 2016 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/624010 | |
dc.description.abstract | İnternetin sürekli olarak gelişmesi ve hayatımızın vazgeçilmesi olması ile beraber birtakım sosyal paylaşım siteleri ortaya çıkmıştır. İnsanların fikirlerini paylaştığı ve etkileşimde bulunduğu bu sosyal medya platformları veri kaynağı açısından bilim insanlarının adresi olmuştur. İnsanlar günümüzde istedikleri bilgiye internet üzerinden yaptıkları aramalarla kolaylıkla ulaşabilmektedir. İnternetteki bilgilerin çoğu geribildirime açık olup bu geri bildirimler anketler ve forum siteleri aracılığıyla yeni fikirlerin analizi için toplanmaktadır. Çok fazla internet kullanıcısı olmasından dolayı geri bildirimlerin insan tarafından analiz edilmesi çok zordur. İşte bu noktada duygu analizi kavramı ortaya çıkmıştır. Duygu analizi, metinlerdeki bir konu hakkındaki duygu ve düşüncenin analiz edilerek duygunun pozitif ve negatif olarak sınıflandırılmasını amaçlar. Öznitelik seçimi sınıflandırma performansı ve başarısını arttırmak için günümüzde sıklıkla kullanılmaktadır. Bu seçimde farklı metotlar kullanılmakta olup amaçlanan veri kümesi içinden sınıflandırmadaki başarıyı etkileyen alakasız niteliklerin devre dışı bırakılıp önemli niteliklerin seçilmesidir. Bu şekilde başarı oranı arttırılabilir. Bu tez çalışmasında günlük konuşma dili ile yazılan Türkçe metinlerden öznitelik seçimine odaklanılmış olup detaylı ön işlemeden geçen veri üzerinde destek vektör makineleri, yapay sinir ağları ve centroid tabanlı sınıflandırma algoritmaları kullanılmıştır. 3 ayrı GSM operatörünün takipçilerine ait tweetler üzerinde Gini İndeks, Bilgi Kazancı ve Genetik Algoritma 3 farklı sınıflandırma algoritmasıyla hibrit olarak kullanılmıştır. Özellikle boyut indirgemede önemli bir yere sahip olan ve sezgisel olarak çalışan genetik algoritma ile destek vektör makineleri hibrit olarak kullanıldığında 3 farklı GSM operatörü için de %100 başarı elde edilmiştir. | |
dc.description.abstract | Several social media websites are showed up as Internet's improving continously and becoming an irreplaceable part of our lives. Those sites that people share their opinions and interact with others have become the address of scientists in terms of data source.People can access any information they need easily by doing research on Internet these days. Many of the data are open for feedbacks and these feedbacks are gathered for analyses of new ideas by surveys and forum sites. It is too hard to analyze feedbacks by a person as there are so many Internet users. At this point, emotion analysis concept showed up. Emotion analysis is aimed at classify the emotion as positive and negative by analyze the emotion and thought about a topic in texts. Entity property selection is used frequently nowadays in order to increase the performance and success in classification. Different methods are used in this selection and it is selecting the important qualities by eliminating the irrelevant features that affect the success in classification in target data set. Thus, hit ratio may increase. In this thesis, feature selection from Turkish texts written as colloquial is focused and support vector machine, artificial neural networks and centroid based classification algorithms are used on data that has detailed preprocessing. Gini Index, Information Gain and Genetic Algorithm are used as hybrids with 3 different classification algorithms on tweets belonging to 3 different GSM operators' followers. 100% success is achieved for 3 different GSM operators when genetic algorithm, which works as intuitively and has an important role in dimension reduction, and support vector machines are used hybridly. | en_US |
dc.language | Turkish | |
dc.language.iso | tr | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Doğal dil işleme yöntemleriyle Türkçe sosyal medya verileri üzerinde duygu analizi | |
dc.title.alternative | Sentiment analysis with natural language processing methods on Turkish social media data | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Bilgisayar Mühendisliği Ana Bilim Dalı | |
dc.identifier.yokid | 10120873 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | İSTANBUL AYDIN ÜNİVERSİTESİ | |
dc.identifier.thesisid | 462765 | |
dc.description.pages | 91 | |
dc.publisher.discipline | Bilgisayar Mühendisliği Bilim Dalı |