کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6857030 1437976 2018 16 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Exploiting reject option in classification for social discrimination control
ترجمه فارسی عنوان
بهره برداری از گزینه رد در طبقه بندی برای کنترل تبعیض اجتماعی
کلمات کلیدی
داده کاوی تبعیض آمیز، عادلانه بودن در یادگیری ماشین، طبقه بندی، تئوری تصمیم گیری،
ترجمه چکیده
گفته می شود که تبعیض اجتماعی زمانی اتفاق می افتد که تصمیم ناخوشایندی برای یک فرد تحت تأثیر عضویت خود را به گروه های محافظت شده خاص مانند زنان و گروه های قومی اقلیت تأثیر می گذارد. چنین تصمیمات تبعیض آمیز اغلب در داده های تاریخی وجود دارد. علیرغم کارهای اخیر در زمینه معاونت اطلاع رسانی تبعیض آمیز، نیاز به روش های قوی و در عین حال به راحتی قابل استفاده برای کنترل اختلال وجود دارد. در این مقاله، از گزینه رد شدن در طبقه بندی، چارچوب نظری تصمیم کلی برای دست زدن به مواردی که برچسب ها نامشخص هستند، برای مدل سازی و کنترل تصمیمات تبعیض آمیز استفاده می کنیم. به طور خاص، این چارچوب اجازه رفتار رسمی شهود را می دهد که موارد نزدیک به مرز تصمیم گیری بیشتر در یک مجموعه داده تبعیض آمیز است. بر اساس این چارچوب، ما سه راه حل متفاوت برای طبقه بندی آگاهانه تبعیض ارائه می دهیم. راه حل اول، رد احتمالی را در طبقه بندی های احتمالاتی تک و چندگانه ایفا می کند، در حالی که راه حل دوم به تکانه های گروهبندی وابسته است. راه حل سوم یکی از دو راه حل اول را با تست وضعیت که یک روش معمول در دادگاه است مورد استفاده قرار می دهد. تمام راه حل ها برای استفاده آسان و توجیه قوی برای تصمیم گیری استفاده می شود. ما راه حل های ما را به طور گسترده در چهار مجموعه داده های دنیای واقعی ارزیابی می کنیم و عملکرد آنها را با طبقه بندی های پیشنهادی تبعیض آمیز پیشنهادی مقایسه می کنیم. نتایج نشان می دهد برتر بودن راه حل های ما از لحاظ عملکرد و انعطاف پذیری کاربرد پذیری. به طور خاص، راه حل های ما در برداشتن تبعیض غیرقانونی از پیش بینی ها موثر است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Social discrimination is said to occur when an unfavorable decision for an individual is influenced by her membership to certain protected groups such as females and minority ethnic groups. Such discriminatory decisions often exist in historical data. Despite recent works in discrimination-aware data mining, there remains the need for robust, yet easily usable, methods for discrimination control. In this paper, we utilize reject option in classification, a general decision theoretic framework for handling instances whose labels are uncertain, for modeling and controlling discriminatory decisions. Specifically, this framework permits a formal treatment of the intuition that instances close to the decision boundary are more likely to be discriminated in a dataset. Based on this framework, we present three different solutions for discrimination-aware classification. The first solution invokes probabilistic rejection in single or multiple probabilistic classifiers while the second solution relies upon ensemble rejection in classifier ensembles. The third solution integrates one of the first two solutions with situation testing which is a procedure commonly used in the court of law. All solutions are easy to use and provide strong justifications for the decisions. We evaluate our solutions extensively on four real-world datasets and compare their performances with previously proposed discrimination-aware classifiers. The results demonstrate the superiority of our solutions in terms of both performance and flexibility of applicability. In particular, our solutions are effective at removing illegal discrimination from the predictions.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 425, January 2018, Pages 18-33
نویسندگان
, , , ,