Improving performance of privacy-preserving collaborative filtering schemes
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Gizliliği koruyan ortak süzgeçleme yöntemleri bireylerin gizliliklerini tehlikeye atmadan yararlı süzgeçleme becerileri ortaya koymaktadır. Ancak bu sistemler doğruluk, ölçeklenebilirlik ve boşluklu veri sorunlarıyla karşı karşıyadır. Gizli kalması gereken tercihlerin saklı tutulması için uygulanan gizlilik ölçütleri, toplanan veride bozulmaya yol açar ve dolayısıyla gizliliği koruyan ortak süzgeçleme sistemlerinin doğruluğuna zarar verebilir. Öneri alanındaki içerik genişledikçe toplanan verinin boyutları hızlı biçimde büyür ve sistemlerin ölçeklenebilirlik sorunlarını daha da zorlaştırır. Ek olarak, kullanıcılar mevcut ürünlerin genelde küçük bir yüzdesine tercih belirtebildiklerinden dolayı derlenen verinin boşluklu yapısı bir sorun haline gelmektedir.Bu tezde gizliliği koruyan ortak süzgeçleme sistemlerinin karşılaştığı doğruluk, ölçeklenebilirlik ve boşluklu veri sorunlarınının üstesinden gelmek üzere çeşitli önişleme yöntemleri önerilmiştir. Ürün sıralama ve eleme, kümeleme,boyut indirgeme, kullanıcı ayrımlama, profil klonlama vb. gibi önerilen önişleme yöntemlerinim uygulanmasıyla yeni gizliliği koruyan ortak süzgeçleme şemaları geliştirilmiştir. Önerilen önişleme ile iyileştirilmiş şemalar kişilerin gizliliğinitehlikeye sokmadan, verinin sürekli genişleyen yapısıyla başa çıkabilmek ve yeterli doğrulukla öneriler üretmek üzerine odaklanmıştır. Önerilen taslaklar, sağlanan gizlilik ve ortaya çıkan ek yükler açısından analiz edilmiştir. Ayrıca gerçek veri tabanlı deneyler yapılarak, bu taslakların doğruluk, ölçeklenebilirlik ve gizliliğe etkileri ölçülmüştür. Analizler ve deneysel sonuçlar yöntemlerin gizliliği koruduğunu ve ölçeklenebilir zaman dilimleri içinde yeterli doğrulukla öneriler ürettiğini göstermiştir.Anahtar Kelimeler: Önizleme; Gizlilik; Ölçeklenebilirlik; Doğruluk; Boşlukluveri; Ortak süzgeçleme. Privacy-preserving collaborative filtering methods offer useful filtering skills without deeply jeopardizing individual privacy. However, they mostly suffer from accuracy, scalability, and sparseness problems. Applying privacy measures to conceal confidential data in recommendation systems causes a bias in collected data, which might make accuracy worse. As the content in recommendation domain proliferates, the size of collected data expands rapidly, which aggravates scalability challenge of those systems. In addition, since users are typically able to rate a small fraction of existing products, sparseness of collected data becomes an issue.In this dissertation, various preprocessing methods are proposed to overcome accuracy, scalability, and sparseness challenges faced by various privacy-preserving collaborative filtering systems. Through application of the proposed preprocessing techniques like item ordering and elimination, clustering, dimensionality reduction, user profiling, profile cloning, and son on, novel privacy-preserving collaborative filtering schemes are cultivated. Essentially, the proposed enhanced systems focus on producing accurate predictions while coping with constantly growing nature of collections without jeopardizing individual privacy. The proposed schemes are analyzed in terms of privacy and overhead costs. Also, real data-based experiments are performed to scrutinize their effects on accuracy, scalability, and privacy. The analysis and experimental outcomes demonstrate that the methods preserve individual privacy and offer adequately accurate recommendations in scalable amount of time.Keywords: Preprocessing; Privacy; Scalability; Accuracy; Sparsity; Collaborative ?ltering.
Collections