کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6937909 1449890 2019 14 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Utility-preserving privacy protection of nominal data sets via semantic rank swapping
ترجمه فارسی عنوان
حفظ حفاظت از حفظ حریم خصوصی از مجموعه داده های اسمی با استفاده از معادله رتبه بندی مبادله
کلمات کلیدی
مبادله رتبه داده های اسمی، معناشناسی، هستی شناسی،
ترجمه چکیده
داده های شخصی برای تحقیقات بسیار مهم هستند، اما در عین حال، آنها یک خطر جدی برای حفظ حریم خصوصی هستند. بنابراین، قبل از اینکه داده های شخصی برای استفاده ثانوی در دسترس باشد، اقدامات حفاظت از داده ها باید توسط کنترل کننده داده انجام شود. همچنین، حفاظت از داده ها باید به نحوی انجام شود که داده ها هنوز برای تجزیه و تحلیل مفید هستند. در سالهای گذشته، بسیاری از مکانیسم های حفاظت از داده ها پیشنهاد شده است. در میان آنها، مبادله رتبه بندی یکی از بهترین ها با توجه به کمینه سازی خطر افشای و حفاظت از ابزار داده محسوب می شود. از آنجا که مبادله رتبه بندی براساس داده های ورودی مرتب سازی شده به مبادله مقادیر نزدیک به یکدیگر است، در اصل، این یک روش محدود به داده های قطعی و عددی است. با این حال، مقدار قابل توجهی از اطلاعات شخصی که در حال حاضر برای تجزیه و تحلیل داده ها جمع آوری شده و مورد استفاده قرار می گیرد، نامی است و کاربرد آنها بستگی به معانی آن ها دارد. برای به درستی مقابله با این نوع داده ها، در این مقاله، ما روش های مبادله رتبه بندی را قادر به محافظت از داده های اسمی از دیدگاه معنایی ارائه می کنیم. به طور خاص، با بهره گیری از هستی شناسی ها، روش های ما قادر به محافظت از اطلاعات اسمی هستند، در حالی که به درستی حفظ معانی آنها و به این ترتیب، ابزار تحلیلی آنها. برای این، ما یک رابطه باینری مناسب را برای داده های اسمی ارزیابی معنایی ارائه می دهیم. پیشنهاد ما قادر به مدیریت هر دو ویژگی مستقل فردی و مجموعه داده های چند متغیره غیر مستقل می باشد، که اخیرا مخصوصا برای تحلیل داده ها مناسب است. تجربی تجربی بر روی پرونده های بالینی واقعی و با استفاده از هستی شناسی استاندارد پزشکی نشان می دهد که روش های ما قادر به حفظ ویژگی های معنایی داده های اسمی به طور قابل توجهی بهتر از مکانیسم های جایگزین استاندارد است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Personal data are of great interest for research but, at the same time, they pose a serious privacy risk. Therefore, appropriate data protection measures should be undertaken by the data controller before making personal data available for secondary use. Also, such data protection should be done in a way that data are still useful for analysis. In the last years, a plethora of data protection mechanisms have been proposed. Among them, rank swapping is considered one of the best with respect to disclosure risk minimization and data utility preservation. Because rank swapping is based on sorting input data to swap values that are close to each other, in principle, it is a method restricted to numerical and ordinal categorical data. However, a significant amount of personal data currently compiled and used in data analysis are nominal, and their utility depends on the semantics they convey. To properly cope with this type of data, in this paper, we present rank swapping methods capable of protecting nominal data from a semantic perspective. Specifically, by exploiting ontologies, our methods are able to protect nominal data while properly preserving their semantics and, thus, their analytical utility. For that, we provide a suitable binary relation to semantically sort nominal data. Our proposal is capable of managing both independent individual attributes and non-independent multivariate data sets, being the latter especially relevant for data analysis. Empirical experiments carried on real clinical records and using a standard medical ontology show that our methods are able to preserve the semantic features of nominal data significantly better than standard permutation mechanisms.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Fusion - Volume 45, January 2019, Pages 282-295
نویسندگان
, , ,