Sağlık hizmetlerinde anonimlik: Dağıtık yapılar için ideal bir veri paylaşım modeli

Canbay, Pelin

View/Open

File_10060419 (2.065Mb)

Date

2014

Author

Canbay, Pelin

Metadata

Show full item record

Abstract

Sağlık kuruluşları tarafından elde edilen (kayıt altına alınan) veriler, birçok alanda ileriye yönelik çözümler üretmek için olağanüstü fırsatlar sunmaktadır. Sağlık hizmetleri alanında faydalı sonuçlar üretebilmek için doğru (gerçek - tutarlı) verilerin paylaşılması gerekmektedir. Sağlık sistemlerinde tutulan kişisel sağlık kayıtlarının bireyler ile ilgili hassas bilgiler içermesinden dolayı, bu kayıtların sadece adı, soyadı ve kimlik numarası gibi bilgilerinin çıkarılarak başka hiçbir düzenleme yapılmadan doğrudan paylaşılması, bireysel mahremiyetin ihlal edilmesine sebep olmaktadır. Literatüre bakıldığında, mahremiyet ihlaline sebep olmadan, eldeki verilerden alınabilecek faydayı olabildiğince maksimum seviyede tutmayı hedefleyen birçok mahremiyet korumalı veri paylaşım yaklaşımı geliştirilmiştir. Özellikle son yıllarda Mahremiyet Korumalı Veri Madenciliği (Privacy-Preserving Data Mining (PPDM)) ve Mahremiyet Korumalı Veri Yayıncılığı (Privacy-Preserving Data Publishing (PPDP)) yaklaşımları, kişisel veya kurumsal mahremiyeti korumak adına kapsamlı olarak çalışılmıştır. Bu tez çalışmasında; Mahremiyet Korumalı Veri Madenciliği ve Mahremiyet Korumalı Veri Yayıncılığı yaklaşımları özetlenmiş, sağlık kayıtları çerçevesinde değerlendirilmiş ve sağlık hizmetlerinde, hem mahremiyeti koruyan hem de veri paylaşımına olanak sağlayan bir veri dağıtım modeli önerilmiştir. Burada yapılan çalışmada, dağıtık sağlık kuruluşlarından toplanan verilere, alıcı kurumların ihtiyaçları doğrultusunda bölümleme yapan ve gerekli anonimleştirme ölçütlerini uygulayan, daha sonra bu anonim bilgileri alıcı kurumların hizmetine sunan ideal bir sistem modeli önerilmektedir. Önerilen model; dağıtık veri kümelerinin paylaşımına olanak sağlayan merkezi bir veri dağıtım sisteminin modelidir. Bu modelin gerçekleştiriminde, yatay ve dikey bölümleme teknikleri kullanılarak veriler ayrıştırılmış, daha sonra ayrıştırılan bu veriler k-anonimlik ve ℓ-çeşitlilik ölçütlerine tabi tutularak değerlendirilmiştir. Gerçekleştirme işlemleri olası iki farklı modele daha uygulanmış ve sonuçlar karşılaştırılmıştır. Yapılan işlemler sonucunda, önerilen modelin olası modellere göre hem veri kaybı hem de veri gizliliği açısından en ideal sonucu verdiği gözlemlenmiştir. Önerilen modelin amacı; mahremiyet (gizlilik) koruma ve veri faydası arasındaki dengeyi en ideal seviyede tutmayı sağlamaktır.

Data obtained or recorded by healthcare institutions, present extraordinary opportunities to produce forward solutions in many fields. Sharing accurate (real-consistent) data is necessary to produce useful results in healthcare field. Because of personal health records that are held by health systems include sensitive attributes about individuals, sharing these records after removing information like name, surname and identity number without any editing causes privacy disclosure. In literature, a lot of privacy-preserving data sharing approaches are developed that aims keeping the benefit that can be taken from existing data in maximum level. Especially in recent years, Privacy-Preserving Data Mining and Privacy-Preserving Data Publishing approaches were studied comprehensively to protect personal or institutional privacy.In this thesis, Privacy-Preserving Data Mining and Privacy-Preserving Data Publishing approaches were summarized, evaluated within the framework of health records and a data distribution model that faciliates both protecting privacy and data sharing was proposed.In this work, an ideal system model was proposed that makes partitioning according to needs of recipient institutions and applies necessary anonymization criteria to the collected data from distributed health institutions, then presents this anonymous information to recipient institutions. The proposed model is a central data distribution system model that faciliates sharing of distributed data sets. In implementation of this model, horizontal and vertical partitioning techniques were used to decompose the data, then the decomposed data were evaluated by appliying k-anonymity and ℓ-diversity. The implementation processes were applied to two different models and results were compared. At the end, it was observed that the proposed model gave the ideal result in terms of both data loss and data privacy in comparision with likely models. The aim of the proposed model is keeping the balance between protecting privacy and data benefit in an ideal level.

URI

https://acikbilim.yok.gov.tr/handle/20.500.12812/475992

Collections

TEZLER

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess