کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6857592 665570 2015 20 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Diversity techniques improve the performance of the best imbalance learning ensembles
ترجمه فارسی عنوان
تکنیک های تنوع عملکرد بهترین گروه های یادگیری عدم تعادل را بهبود می بخشد
ترجمه چکیده
بسیاری از مشکلات زندگی واقعی را می توان به عنوان نامتعادل توصیف کرد، جایی که تعداد نمونه هایی که متعلق به یک کلاس هستند بسیار بیشتر از اعداد در کلاس های دیگر است. مثلا تشخیص هرزنامه، تشخیص تقلب کارت اعتباری یا تشخیص پزشکی است. مجموعه ای از طبقه بندی ها در این نوع مشکلات برای توانایی آنها در دستیابی به نتایج بهتر از طبقه بندی های فردی محبوبیت پیدا کرده است. تکنیک های رایج ترین آن دسته از گروه هایی است که به ویژه برای مقابله با مشکلات عدم تعادل طراحی شده اند، به عنوان مثال بازآرایی، بیش از حد نمونه برداری و کمینه سازی نمونه. تکنیک های دیگر که در ابتدا برای افزایش تنوع گروه ها مورد استفاده قرار گرفت، به طور سیستماتیک برای تاثیر آن بر مشکلات عدم تعادل مورد بررسی قرار نگرفته است. در میان این موارد، عبارات تصادفی، همسایگان مضر، وزن مخصوص تصادفی یا جنگل چرخش هستند. این مقاله یک مرور کلی و یک مطالعه تجربی از روش های مختلف مبتنی بر گروه برای مشکلات عدم تعادل ارائه می دهد، روش ها در قالب اصلی و با چندین تکنیک افزایش تنوع، با استفاده از 84 مجموعه داده های نامتجانس از دو مخزن شناخته شده مورد آزمایش قرار گرفته اند. این مقاله نشان می دهد که این تکنیک های افزایش تنوع به طور قابل توجهی بهبود عملکرد روش های گروهی را برای مشکلات عدم تعادل و ارائه ایده هایی در مورد زمانی که راحت تر از این تکنیک های متنوع استفاده می شود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Many real-life problems can be described as unbalanced, where the number of instances belonging to one of the classes is much larger than the numbers in other classes. Examples are spam detection, credit card fraud detection or medical diagnosis. Ensembles of classifiers have acquired popularity in this kind of problems for their ability to obtain better results than individual classifiers. The most commonly used techniques by those ensembles especially designed to deal with imbalanced problems are for example Re-weighting, Oversampling and Undersampling. Other techniques, originally intended to increase the ensemble diversity, have not been systematically studied for their effect on imbalanced problems. Among these are Random Oracles, Disturbing Neighbors, Random Feature Weights or Rotation Forest. This paper presents an overview and an experimental study of various ensemble-based methods for imbalanced problems, the methods have been tested in its original form and in conjunction with several diversity-increasing techniques, using 84 imbalanced data sets from two well known repositories. This paper shows that these diversity-increasing techniques significantly improve the performance of ensemble methods for imbalanced problems and provides some ideas about when it is more convenient to use these diversifying techniques.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 325, 20 December 2015, Pages 98-117
نویسندگان
, , , ,