Sosyal medya profilleri arasında benzerlik tespiti ve gösterimi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
`Sosyal Medya` kullanıcıların bilgi paylaşımında bulunduğu platformlara verilen genel addır. Sosyal medya kullanımı son senelerde oldukça yaygınlaşmıştır. Kullanıcılar birden fazla Sosyal Medya Platformunda kişisel veya gündemdeki olaylar ile alakalı paylaşımlarda bulunmaktadır. Sosyal medyanın geniş kitleler tarafından kullanılması sosyal medya kullanıcıları hakkında bilgilerin çıkarılması ve kullanıcılar arasındaki benzerliklerin tespit edilmesi arayışını ortaya çıkarmıştır. Sosyal medya platformlarındaki kullanıcıların birbirlerine benzerliği tespit edildiği takdirde kullanıcıların eğilimleri, ilgi alanları, önem verdiği konular belirlenebilir. Ayrıca, reklamların hedef kitleye ulaşmasında da bu benzerlik bilgilerinden faydalanılabilir. Bununla birlikte, farklı amaçlarla gerçek sahibinin kim olduğunun doğrulanmasına ihtiyaç duyulan hesaplar da bu bilgiler ışığında tespit edilebilir. Bu çalışmada Doğal Dil İşleme(DDİ) teknikleri kullanarak kullanıcıların paylaşımları arasındaki benzerliklerin tespit edilmesi için geliştirdiğimiz teknikler sunulmuştur. Konu Modelleme ve Adlandırılmış Varlık Tespiti teknikleri kullanılarak kullanıcıların yazılı paylaşımlarından nitelik çıkarımı yapılmıştır. Bu nitelikler Word Embedding teknikleri ve Word Mover's Distance tekniği kullanılarak kullanıcılar arasındaki benzerlikler çıkarılmıştır. DDİ tekniklerinin yanında kullanıcıların sosyal medya platformlarını kullandığı saatlerden, kullanıcı bilgilerinden ve kullanıcının arkadaşlarının isimlerinden yola çıkarak kullanıcılar arası benzerlik tespiti için teknikler önerilmiştir. Geliştirilen tekniklerden DDİ teknikleri ile oldukça etkili sonuçlar alınmıştır. Bu teknikler yardımı ile verilen bir kullanıcı kümesindeki toplulukların ve öbeklerin tespit edilebildiği gösterilmiştir. Ayrıca farklı sosyal medya platformlarındaki profiller arasında benzerlik tespiti yapılarak aynı kişiye ait sosyal medya profillerinin tespit edilebildiği gösterilmiştir. Çalışmada geliştirilen metriklerin farklı kullanıcı kümelerinde daha kolay denenmesi amacıyla bir web uygulaması geliştirilmiştir. Bu web uygulaması kullanıcılar arası benzerliklerin detaylı incelenmesini mümkün kılmıştır. Social Media is a generic name given to the digital platforms where users share information. The use of social media has become very popular in recent years. Users share personal information or their ideas about daily events on different social media platforms. The widespread use of social media has led to an interest to extract information from social media profiles and detect similarities among users. If similarity is detected between users, this information can be used to determine the tendencies, interests of users, the things that he/she cares about. Also such an information would make advertisements reach to their target audience. In addition, this information can be used in cases where there is a need to verify the real owner of a social media account. In this study, we have developed techniques to determine the similarities among the users using Natural Language Processing (NLP) techniques. Additionally attempts have been made to identify similarities between users by users' access hours to the platform and users' friends list. However, more effective results were obtained with NLP techniques. Topic Modeling and Named Entity Recognition techniques were used to extract features from the posts of users. Similarities between users were derived by feeding these features to Word Mover's Distance algorithm. Effective results have been obtained using the techniques developed with NLP techniques. It has been shown that communities and clusters in a user set can be detected with the help of these techniques. It has also been shown that social media profiles belonging to a person can be detected by identifying similarities among profiles in different social media platforms. In addition, a web application is developed to make it easier to experiment with the metrics developed in this work.
Collections