Facebook`da yorum madenciliği kullanarak, kişilerin cinsiyet, yaş ve eğitim düzeylerinin tanımlanması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Sosyal medyanın günden güne toplumun farklı tabakalarına yayılmasıyla beraber, yararlı işlevlerinin yanında, bireysel hak ihlallerine yol açan kötüye kullanımları da artmaktadır. Bazı kişiler gerçek olmayan bilgilerle sahte hesaplar açarak, insanları hem maddi hem de manevi yönde istismar etmektedir. Bazen de sahtekarlar, daha küçük yaşta olduklarını belirterek çocuk istismarını hedeflemektedirler ya da kendilerini karşı cins veya olduğundan daha yüksek eğitim seviyesinde göstererek insanları aldatmaktadırlar. Sosyal medyadaki insanların gerçek kimliklerini tespit etmek, e-suç oluşumunun engellenmesinde büyük bir etki yaratabilir. Bu çalışmada Facebook kullanıcılarının yorumlarını analiz ederek, Cinsiyet, Yaş ve Eğitim düzeyini belirlemek için bir sistem geliştirilmiştir. Bu çalışmada kullanılan veri kümesi, Türkçe Facebook sayfalarından toplanan yorumlardan oluşturulmuştur. Genel metin madenciliği işlemleri uygulandıktan sonra ?Significance Analysis of Microarrays? (SAM) yöntemi, nitelik ağırlıklandırmak ve boyut azaltma işlemi için kullanılmıştır. Kişileri sınıflandırmak için Naive Bayes, ?Support Vector Machine? (SVM) ve K-en yakın komşuluk (KNN) sınıflandırma yöntemleri kullanılmış ve elde edilen sonuçlar karşılaştırılmıştır. Ayrıca terim vektörü için farklı ağırlıklandırma yöntemleri karşılaştırılmıştır. As the use of social media rises in different layers of the society, alongside of useful applications, some abuses of these media are also rising. The people who create fake accounts with a profile details differ from what they really are and pretending opposite gender, lower age, or higher education level for cheating people or hiding real identity are some of the abuses of the social media. Identifying real identity of a person in social media can be vital for preventing crimes. In this study, a system implemented to identify Gender, Age and Education level of a Facebook user by analyzing the comments he/she wrote on different shares of the Facebook pages in Turkish. The data used in this study is collected from Facebook social media. After applying common text mining operations on data, Significant Analysis of Microarrays (SAM) method is employed for weighting and dimension reduction of the data. The Naïve Bayesian, Support vector machine (SVM) and K-Nearest Neighbors (KNN) classification methods used for classifying. In addition, the effect of using different term weights in vector space model investigated.
Collections