Show simple item record

dc.contributor.advisorSaygın, Yücel
dc.contributor.authorAzgin Hintoğlu, Ayça
dc.date.accessioned2020-12-10T07:35:49Z
dc.date.available2020-12-10T07:35:49Z
dc.date.submitted2011
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/217103
dc.description.abstractİnternet devrimi ve bilgisayar teknolojisinin ilerlemesi ile birlikte, kurumların dahaönce benzeri görülmemiş miktarda kişisel veri toplaması mümkün olmuştur. Yaygınlaşanveri toplama aktiviteleri, artan veri paylaşma ihtiyacı ile birleştiğinde veri mahremiyetiile ilgili endişeleri tetiklemiştir. Ayrıca kurumların oldukça büyük veri setlerindenönceden bilinmeyen ancak stratejik olarak faydalı bilgileri bulmasını sağlayan veri madenciliği tekniklerinin yaygınlaşması da mahremiyetle ilgili endişeleri arttırmıştır.Veri paylaşımı esnasında mahremiyeti sağlamanın bir yolu gizlenmesi gereken verialanlarının tek tek saklanması ya da genellenmesidir. Ancak, veri madenciliği teknikleri ile kötü niyetli kullanıcıların verinin geri kalanını kullanarak,saklanmış ya da genellenmiş veri alanlarını tahmin etmesi mümkün olmaktadır.Bu tez kapsamında popüler tahminsel veri madenciliği tekniklerinden biri olansınıflandırmaya odaklanılarak, verilen bir veri setini gerek veri alanlarını silerek gereksegenelleyerek güncelleyen, olasılıksal ve karar ağacı kökenli sınıflandırma tekniklerinedayalı çıkarımları önleyen algoritmalar önerilmektedir.Önerilen algoritmaların performansları gerçek veri setleri kullanılarak test edilmiştir.Test sonuçları, önerilen algoritmaların veri setlerini başarı ile baskıladığını ve hem olasılıksalhem de karar ağacı kökenli sınıflandırma tekniklerine dayalı çıkarımları engellediğini göstermiştir.Algoritmalarınaynı anda hem olasılıksal hem de karar ağacı kökenli sınıflandırma tekniklerine dayalıçıkarımları önleyen melez sürümleri, gizli verileri çok daha az yan etki ile saklamayıbaşarmıştır. Benzer şekilde, algoritmaların birden fazla gizli veri alanını saklamayıhedefleyen gelişmiş sürümlerinin, yan etkileri %50 civarında azalttığı gözlenmiştir.
dc.description.abstractThe revolution of Internet together with the progression in computer technologymakes it easy for institutions to collect unprecedented amount of personal data. Thispervasive data collection rally coupled with the increasing necessity of sharing of itraised a lot of concerns about privacy. Widespread usage of data mining techniques,enabling institutions to extract previously unknown and strategically useful informationfrom huge collections of data sets, and thus gain competitive advantages, has alsocontributed to the fears about privacy.One method to ensure privacy during disclosure is to selectively hide or generalizethe confidential information. However, with data mining techniques it is now possiblefor an adversary to predict hidden or generalized confidential information using the restof the disclosed data set. We concentrate on one such possible threat, classification,which is a data mining technique widely used for prediction purposes, and proposealgorithms that modify a given microdata set either by inserting unknown values (i.e.deletion) or by generalizing the original values to prevent both probabilistic and decisiontree classification based inference.To evaluate the proposed algorithms we experiment with real-life data sets. Resultsshow that proposed algorithms successfully suppress microdata and prevent bothprobabilistic and decision tree classification based inference. The hybrid versions of thealgorithms, which aim to suppress a confidential data value against both classificationmodels, block the inference channels with substantially less side effects. Similarly, theenhanced versions of the algorithms, which aim to suppress multiple confidential datavalues, reduce the side effects by nearly 50%.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleSuppressing microdata to prevent classification based inference
dc.title.alternativeVeriyi bastırmak suretiyle sınıflandırma tabanlı çıkarımın engellenmesi
dc.typedoctoralThesis
dc.date.updated2018-08-06
dc.contributor.departmentElektronik Mühendisliği ve Bilgisayar Bilimi Anabilim Dalı
dc.subject.ytmData mining
dc.identifier.yokid412279
dc.publisher.instituteMühendislik ve Fen Bilimleri Enstitüsü
dc.publisher.universitySABANCI ÜNİVERSİTESİ
dc.identifier.thesisid309428
dc.description.pages126
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess