Identification of anonymous users in twitter
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Kullanıcılar internet ağı üzerinden yorum, blog ve tweet yazarken birden fazla profile sahip olabilirler. Bu kullanıcıların bir kısmı gerçek kimliklerini ortaya çıkarırken, diğer kısmı profillerini anonim olarak takma isimle oluştururlar. Bu durum özellikle eylemcilerin tweet ya da Facebook mesajlarını anonim olarak yazdığı baskıcı hükümetlerin bulunduğu ülkelerde çok gereklidir. Bu ülkelerde, eylemcilerin arasında bulunan kişilerin ciddi sorunlarla karşılaşabileceği, hapis cezasına çarptırılabilecekleri ve hatta hayatlarının riske atılmış olabileceği gerçeği hükümet yetkilileri tarafından ortaya konulmuştur. Her ne kadar takma isimli bir hesaba sahip olmak belli olaranda gizlilik sağlasa da yazarların yazım şablonu, anonim hesapları ve gerçek hesapları ilişkilendirmek için ipuçları verebilir. Daha belirgin olarak, birileri yazarı bilinen bir yazının özelliklerine bakarak bu özelliklerden bir model oluşturabilir ve bu oluşturduğu modeli verilen başka bir anonim yazının bu yazara ait olup olmadığını tahmin etmek için kullanabilir. Bu çalışmada ilk olarak, verilen bir kişinin tweet'lerine bakarak bu kişinin belirli bir grubun parçası olarak tanımlanabileceğini kanıtlayacağız. Biz bu çalışma için çok popüler bir platform olan Twitter'ı kullanmış olsak da bu problemin sadece Twitter ile kısıtlı olmadığını belirtmek isteriz. Gösterdiğimiz diğer bir nokta, bir aleyhtar gerçek isimli kullanıcıların tweet'lerini kullanarak, bu gerçek hesapları anonim hesaplarla eşleştirebilmek için bir sınıflandırıcı yaratabilir. Biz bu çalışmada dökümanları temsil eden kelimelerin tf-idf ağırlıklarından oluşan bir vektor uzayı, Naive-Bayes sınıflandırıcı ve cosinüs benzerliği ölçüsü kullanmaktayız. Ayrıca problemimizi tanımlayan bir formalizm oluşturarak, tweet yazarken anonim kalmaya davam etmek isteyen bireyler için oluşturduğumuz formalizm üzerinden gizliliği korumaya yönelik bazı çözümler de ortaya koymaktayız. Users may have multiple profiles when writing comments, blogs, and tweets on the web. While some of these profiles reveal true identity, the others are created under pseudonyms. This is essential especially in the countries with oppressive governments where activists are writing pseudonymous tweets or Facebook messages. In these countries, government officials discovering the fact that a person is among the activists may have serious consequences, the activist being imprisoned, or even his or her life being jeopardized. Pseudonyms may provide a sense of anonymity, however the writing patterns of an author can provide clues that can be used to link the pseudonymous account to the public account. More specifically, one can look at some features within the text whose author is known, and build a model by using these features to predict whether a given (supposedly) anonymous text belongs to that author or not. In this work, we first demonstrate that a person can be identified as being part of a group by using his/her tweets. We used twitter since it is a popular platform, but the problem is not specific to twitter. We show that through tweets, an adversary can build a classifier from public tweets of known users to match them with pseudonymous twitter accounts. We use a simple vector-space model with tf-idf weights to represent documents and a Naive-Bayes classifer with cosine similarity measure. We show that the problem of matching public and pseudonymous accounts exists in twitter through experiments with real data. We also provide a formalism to describe the problem and based on the formalism we provide a solution to protect the privacy of individuals who would like to stay anonymous when writing tweets.
Collections