Twıtter üzerindeki islamofobik tweetlerin duygu analizi ile tespiti
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Özellikle sosyal medya ağlarındaki büyük yükseliş, internet kullanıcıları tarafındanoluşturulan web içeriğinin analiz edilmesi üzerine yapılan araştırmalarında artmasına nedenolmuştur. Araştırmalar, insanların nefret içerikli, rahatsız edici yorumlar yapmak içinpopüler sosyal ağları, özellikle Twitter platformunu kullanabildiğini ve bu tür içeriklerinbelli bir toplumsal grubu hedef alabildiğini göstermektedir. Özellikle son yıllardaİslamofobia konusunda yapılan çalışmalarda, islamofobik tweetlerin sınıflandırması içintweet içerisinde `hateislam` gibi anahtar kelimelerin geçip geçmediğine bakıldığıgörülmektedir. Bununla birlikte, İslamofobi söyleminin çok yönlü doğası, kavramsal arkaplanı düşünüldüğünde, sadece önceden belirlenen anahtar kelimelerin taranmasına göreyapılacak bir sınıflandırmanın yeterli doğrulukta sonuç vermeyeceği düşünülmüştür. Bu tezçalışmasında islamofobik tweetlerin sınıflandırılması için yapay zeka tekniklerindengözetimli makine öğrenmesi yöntemi kullanılmıştır. Yapay sinir ağının eğitimi ve testişlemlerinde kullanılmak üzere bir veri seti oluşturulmuştur. Bu amaçla twitterin aramakısmı üzerinden `Islam`, `Muslim` gibi kelimelerin geçtiği İngilizce dilinde yazılmış290.000 tweet, Twitter API kullanılarak geliştirilen yazılımla elde edilmiştir. Çeşitli önişleme adımlarının ardından kalan 162.000 tweet, beş kişilik bir ekip tarafından İslamofobikve İslamofobik değil şeklinde işaretlenmiştir. İşaretlemenin ardından tweetlerin %80'ieğitim ve %20'si test amaçlı olarak ayrılmıştır. Elde edilen veri seti Bayes Regresyonu,Ridge Regresyonu ve derin öğrenme modeli olmak üzere 3 farklı modele uygulanmıştır.Testlerde her üç model içinde %95'in üzerinde doğruluğa ulaşılmış olmasına rağmen veriseti içerisinde olmayan 100 yeni tweet ile yapılan deneysel çalışmada bu oranların nispetendüştüğü gözlemlenmiştir. Especially, the great rise in social networks has caused an increase in the reseaches on theanalysis of web content created by internet users. Research shows that people can usepopular social networks, especially the Twitter platform, in order to make hateful, offensivecomments, and it is shown that such content can target a particular social group. Especially,in recent years, it is observed whether keywords such as 'hateislam' are included in an tweetin order to classify the Islamophobic tweets in studies on Islamophobia. Besides,consedering the versatile nature and conceptual background of Islamophobia, it is thoughtthat a classification based on the search of predetermined keywords will not yield sufficientaccuracy. In this thesis study, machine learning method, which is one of the artificialintelligence techniques, is used to classify islamophobic tweets. A data set has been createdto be used in training and testing operations of the artificial neural network. For this purpose,290,000 tweets written in the English language in which words such as `Islam` and`Muslim` pass through the search section of the Twitter, are obtained with the softwaredeveloped using the Twitter API. The remaining 162,000 tweets after various preprocessingsteps have been marked by a team of five as Islamophobic and non-Islamophobic. 80% ofthe tweets are reserved for training and 20% for testing purposes after marking. The data setobtained was applied to 3 different models: Bayes Regression, Ridge Regression and deeplearning model. Although more than 95% accuracy was achieved in all three models in thetests, it was observed that these rates decreased relatively in the experimental studyconducted with 100 new tweets that are not included in the data set.
Collections