کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4943577 1437628 2017 50 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Differentially private random decision forests using smooth sensitivity
ترجمه فارسی عنوان
جنگل های تصمیم گیری تصادفی خصوصی با استفاده از حساسیت صاف
کلمات کلیدی
حریم خصوصی، داده کاوی، درخت تصمیم گیری، تصمیم گیری جنگل، حریم خصوصی دیفرانسیل حساسیت صاف،
ترجمه چکیده
ما یک الگوریتم تصمیم گیری جدید متفاوت و خصوصی را پیشنهاد می دهیم که حداقل تعداد پرس و جو مورد نیاز و حساسیت این نمایش ها را به حداقل می رساند. برای انجام این کار، ما مجموعه ای از درخت های تصمیم گیری تصادفی را ایجاد می کنیم که از پرس و جو کردن داده های خصوصی اجتناب می ورزد، به جز برای پیدا کردن برچسب کلاس اکثریت در گره های برگ. به جای استفاده از یک پرس و جو شمارش برای بازگرداندن کلاس های کلاس مانند حالت فعلی از هنر، ما از مکانیسم نمایشی استفاده می کنیم تا تنها برچسب کلاس خود را صادر کنیم. این به شدت حساسیت پرس و جو را کاهش می دهد - اغلب با چندین مرتبه - که به نوبه خود باعث کاهش میزان نویز می شود که باید حفظ شود. حساسیت بهبود یافته ما با استفاده از حساسیت صاف به دست می آید، که به اطلاعات خاصی که در پرس و جو مورد استفاده قرار می گیرد را در نظر می گیرد و نه فرض بر بدترین سناریو. ما همچنین کارهای انجام شده در عمق مطلوب درختان تصمیم تصادفی را برای رسیدگی به ویژگی های مداوم، نه فقط ویژگی های گسسته گسترش می دهیم. این، همراه با چندین پیشرفت دیگر، ما را قادر می سازد تا یک جنگل تصمیم گیری متفاوتی را با قدرت پیش بینی کننده قابل ملاحظه ای نسبت به حالت فعلی پیشرفته ایجاد کنیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
We propose a new differentially-private decision forest algorithm that minimizes both the number of queries required, and the sensitivity of those queries. To do so, we build an ensemble of random decision trees that avoids querying the private data except to find the majority class label in the leaf nodes. Rather than using a count query to return the class counts like the current state-of-the-art, we use the Exponential Mechanism to only output the class label itself. This drastically reduces the sensitivity of the query - often by several orders of magnitude - which in turn reduces the amount of noise that must be added to preserve privacy. Our improved sensitivity is achieved by using “smooth sensitivity”, which takes into account the specific data used in the query rather than assuming the worst-case scenario. We also extend work done on the optimal depth of random decision trees to handle continuous features, not just discrete features. This, along with several other improvements, allows us to create a differentially private decision forest with substantially higher predictive power than the current state-of-the-art.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 78, 15 July 2017, Pages 16-31
نویسندگان
, ,