کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6857170 661905 2016 13 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A hybrid approach to prevent composition attacks for independent data releases
ترجمه فارسی عنوان
یک روش ترکیبی برای جلوگیری از حملات ترکیبی برای انتشار اطلاعات مستقل
کلمات کلیدی
حریم خصوصی، ناشناس شدن حمله ساختگی،
ترجمه چکیده
شناسایی داده ها یکی از تکنیک های اصلی استفاده شده در حفظ حریم خصوصی انتشار داده ها است و بسیاری از روش های ارائه شده برای شناسایی هر دو مجموعه داده های فردی و مجموعه داده های چندگانه پیشنهاد شده است. در زندگی واقعی یک مجموعه داده به ندرت جدا می شود و دو مجموعه داده منتشر شده توسط سازمان های مختلف ممکن است حاوی سوابق مربوط به یک فرد باشد. به عنوان مثال، برخی از بیماران ممکن است از دو بیمارستان برای بیماری مشابه بازدید کرده باشند و پرونده های آنها به طور مستقل ناشناس و منتشر شده توسط دو بیمارستان است. هرچند هر داده منتشر شده تنها ممکن است یک خطر امنیتی کوچک باشد، ترکیب دو مجموعه داده ممکن است به شدت به حریم خصوصی افرادی که برای هر دو مجموعه داده رایج است، به خطر بیفتد. حمله به حریم شخصی فرد که از مجموعه داده های مستقل استفاده می کند، حمله ترکیبی نامیده می شود. موضوع چگونگی شناسایی مجموعه داده ها برای جلوگیری از حمله ترکیبی با استفاده از انتشار داده های مستقل به طور گسترده مورد بررسی قرار نگرفته است. در این مقاله، ما یک اصل جدید برای حفاظت از مجموعه داده ها از حملات ترکیبی پیشنهاد می کنیم. ما یک الگوریتم ترکیبی پیشنهاد می کنیم که ترکیبی از نمونه برداری، اختلال و تعمیم برای محافظت از حریم خصوصی داده ها از حملات ترکیبی است. ما به طور تجربی نشان دادیم که تکنیک ناشناس سازی پیشنهادی به طور قابل توجهی خطر حملات ترکیبی را کاهش می دهد و همچنین ابزار مفید داده ها را حفظ می کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Data anonymization is one of the main techniques used in privacy preserving data publishing, and many methods have been proposed to anonymize both individual data sets and multiple data sets. In real life, a data set is rarely isolated and two data sets published by different organizations may contain records pertaining to the same individual. For example, some patients might have visited two hospitals for the same disease, and their records are independently anonymized and published by the two hospitals. Although each published data set alone might pose a small privacy risk, the combination of two data sets may severely compromise the privacy of the individuals common to both data sets. An attack on individual privacy which uses independent data sets is called a composition attack. The topic of how to anonymize data sets to prevent a composition attack using independent data releases has not been widely investigated. In this paper, we propose a new principle to protect data sets from composition attacks. We propose a hybrid algorithm, which combines sampling, perturbation and generalization to protect data privacy from composition attacks. We experimentally demonstrate that the proposed anonymization technique significantly reduces the risk of composition attacks and also preserves good data utility.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volumes 367–368, 1 November 2016, Pages 324-336
نویسندگان
, , , , , ,