کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6938641 1449963 2018 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Online multi-label streaming feature selection based on neighborhood rough set
ترجمه فارسی عنوان
انتخاب ویژگی های جریان چند لمسی آنلاین بر اساس مجموعه محله خشن
کلمات کلیدی
ترجمه چکیده
انتخاب چند علامت در بسیاری از برنامه های کاربردی بزرگ توجه زیادی را جلب کرده است. با این حال، روش های انتخاب چندگانه سنتی سنتی معمولا یک سناریوی دنیای واقعی را نادیده می گیرند، به عنوان مثال، ویژگی ها به طور مداوم در طول زمان به یک مدل به یک مدل در یک مدل حرکت می کنند. برای مقابله با این مشکل، ما یک روش جدید انتخاب جدید از چندین برچسب پخش آنلاین را بر اساس محدوده خشن مجموعه ای برای انتخاب یک زیر مجموعه ویژگی که شامل ویژگی های کاملا مرتبط و غیر انحصاری است، ایجاد می کنیم. انگیزه اصلی این است که داده کاوی براساس مجموعه خشن محله، نیازی به دانش پیشینی از ساختار فضای ویژگی ندارد. علاوه بر این، محله های خشن مجموعه ای با داده های مخلوط بدون شکستن محله و ساختار سفارش داده ها. در این مقاله ابتدا حداکثر نزدیکترین همسایه را به عنوان مثال برای گرانول کردن تمام مواردی که می تواند مشکل انتخاب دانه گرایی را در مجموعه خشن محله حل کند، معرفی می کنیم و سپس محدوده خشن مجموعه را در تک برچسب به منظور یادگیری چند لایحه تعمیم می دهیم. در عین حال، یک چارچوب انتخاب چند گزینه ای از ویژگی های جریان آنلاین که شامل انتخاب آنلاین مهم و به روز رسانی افزونگی آنلاین می باشد ارائه شده است. تحت این چارچوب، ما پیشنهاد می دهیم یک معیار برای انتخاب ویژگی های مهم نسبت به ویژگی های در حال حاضر انتخاب شده، و یک محدودیت در همبستگی های دو جانبه بین ویژگی های تحت برچسب برای فیلتر کردن ویژگی های بیش از حد طراحی شده است. یک مطالعه تجربی با استفاده از مجموعه ای از مجموعه داده های معیار، نشان می دهد که روش پیشنهادی از سایر روش های انتخاب چندین الگوی پیشرفته پیشرفته تر است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Multi-label feature selection has grabbed intensive attention in many big data applications. However, traditional multi-label feature selection methods generally ignore a real-world scenario, i.e., the features constantly flow into the model one by one over time. To address this problem, we develop a novel online multi-label streaming feature selection method based on neighborhood rough set to select a feature subset which contains strongly relevant and non-redundant features. The main motivation is that data mining based on neighborhood rough set does not require any priori knowledge of the feature space structure. Moreover, neighborhood rough set deals with mixed data without breaking the neighborhood and order structure of data. In this paper, we first introduce the maximum-nearest-neighbor of instance to granulate all instances which can solve the problem of granularity selection in neighborhood rough set, and then generalize neighborhood rough set in single-label to fit multi-label learning. Meanwhile, an online multi-label streaming feature selection framework, which includes online importance selection and online redundancy update, is presented. Under this framework, we propose a criterion to select the important features relative to the currently selected features, and design a bound on pairwise correlations between features under label set to filter out redundant features. An empirical study using a series of benchmark datasets demonstrates that the proposed method outperforms other state-of-the-art multi-label feature selection methods.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 84, December 2018, Pages 273-287
نویسندگان
, , , , ,