کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4969773 1449980 2017 47 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Granular multi-label feature selection based on mutual information
ترجمه فارسی عنوان
انتخاب چند لایه گرانول بر اساس اطلاعات متقابل
ترجمه چکیده
مانند یادگیری ماشین سنتی، یادگیری چند برچسب با لعن ابعاد مواجه است. برخی از الگوریتم های انتخاب ویژگی برای یادگیری چند لایه پیشنهاد شده است که یا مشکل انتخاب چند لایک را به مشکلات انتخاب چندگانه چندگانه تبدیل می کند یا به طور مستقیم ویژگی های مجموعه داده های چند لای را انتخاب می کند. با این حال، سابق وابستگی به برچسب را حذف می کند یا برچسب های جدیدی را تولید می کند که باعث می شود با مشکلاتی جدی مواجه شوند. دوم، با توجه به وابستگی به برچسب جهانی، اغلب ویژگی های چندگانه یا غیر مرتبط را انتخاب می کنند، زیرا در واقع همه برچسب ها به یکدیگر وابسته نیستند، که ممکن است الگوریتم را اشتباه گرفته و عملکرد طبقه بندی آن را کاهش دهد. برای انتخاب یک زیرمجموعه مناسب تر و جمع و جور و همچنین کشف وابستگی برچسب، یک روش انتخاب گرانشی برای یادگیری چند لایحه با معیار حداکثر ضریب همبستگی حداقل بر اساس اطلاعات متقابل پیشنهاد شده است. معیار حداکثر ضریب همبستگی افزونگی اطمینان حاصل می کند که زیر مجموعه های انتخاب شده شامل اطلاعات بیشتر در مورد طبقه بندی-جدایی ناپذیر است، در حالی که در عین حال، کمترین میزان اضافه کاری را نشان می دهد. گرانولاسیون می تواند به کشف وابستگی برچسب کمک کند. ما در رابطه با جزئیات گرانروی برچسب و عملکرد در چهار مجموعه داده ها، و مقایسه روش پیشنهادی با سایر روش های انتخاب سه ویژگی چند لایک را مقایسه می کنیم. نتایج تجربی نشان می دهد که روش پیشنهاد شده می تواند زیر مجموعه های جمع و جور جمع و جور را انتخاب کند، عملکرد طبقه بندی را بهبود بخشد و از سه روش دیگر در معیار ارزیابی یادگیری چند لایک به طور گسترده ای استفاده کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Like the traditional machine learning, the multi-label learning is faced with the curse of dimensionality. Some feature selection algorithms have been proposed for multi-label learning, which either convert the multi-label feature selection problem into numerous single-label feature selection problems, or directly select features from the multi-label data set. However, the former omit the label dependency, or produce too many new labels leading to learning with significant difficulties; the latter, taking the global label dependency into consideration, usually select a few redundant or irrelevant features, because actually not all labels depend on each other, which may confuse the algorithm and degrade its classification performance. To select a more relevant and compact feature subset as well as explore the label dependency, a granular feature selection method for multi-label learning is proposed with a maximal correlation minimal redundancy criterion based on mutual information. The maximal correlation minimal redundancy criterion makes sure that the selected feature subset contains the most class-discriminative information, while in the meantime exhibits the least intra-redundancy. Granulation can help explore the label dependency. We study the relation of the label granularity and the performance on four data sets, and compare the proposed method with other three multi-label feature selection methods. The experimental results demonstrate that the proposed method can select compact and specific feature subsets, improve the classification performance and performs better than other three methods on the widely-used multi-label learning evaluation criteria.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 67, July 2017, Pages 410-423
نویسندگان
, , ,