کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6861635 1439256 2018 29 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
High-dimensional hybrid feature selection using interaction information-guided search
ترجمه فارسی عنوان
انتخاب ویژگی های ترکیبی با ابعاد بزرگ با استفاده از جستجوی اطلاعات هدایت متقابل
کلمات کلیدی
انتخاب ویژگی، مجموعه داده های با ابعاد بزرگ، الگوریتم های ترکیبی، اطلاعات تعامل، جستجوی پیوسته،
ترجمه چکیده
با رشد سریع مجموعه داده های با ابعاد بزرگ در سال های اخیر، نیاز به کاهش ابعاد داده ها به طور قابل توجهی افزایش یافته است. اگر چه رویکردهای بسته بندی به میزان دقیق تر از تکنیک های فیلتر برای همان تعداد مشخصه های انتخاب شده دست می یابند، فقط چند الگوریتم پیچیده برای مجموعه داده های با ابعاد بزرگ استفاده می شود، زیرا زمان محاسبات بسیار زیاد است. بنابراین ما یک الگوریتم انتخاب جدید ترکیبی را پیشنهاد می دهیم که با محاسبه کارایی با دقت بالا برای داده های با ابعاد بزرگ است. روش پیشنهادی اطلاعات متقابل را برای هدایت جستجو استفاده می کند، به طور پیوسته یک ویژگی را در یک زمان به زیر مجموعه ای که در حال حاضر انتخاب شده است اضافه می کند، و از توقف زودهنگام جلوگیری می کند و از جستجوی بیش از حد جلوگیری می کند. روش ما پویا است و فقط ویژگی های مرتبط و غیر قابل پیش بینی را که به میزان قابل توجهی میزان دقت را بهبود می بخشد را انتخاب می کند. نتایج تجربی ما برای یازده مجموعه داده های با ابعاد بزرگ نشان می دهد که الگوریتم ما به طور مداوم از تکنیک های انتخاب ویژگی های پیشین پیشی می گیرد، در حالی که نیاز به یک مقدار منطقی زمان جستجو دارد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
With the rapid growth of high-dimensional data sets in recent years, the need for reducing the dimensionality of data has grown significantly. Although wrapper approaches tend to achieve higher accuracy rates than filter techniques for the same number of selected features, only a few wrapper algorithms are applicable for high-dimensional data sets because the computational time becomes very excessive. We thus propose a new hybrid feature selection algorithm that is computationally efficient with high accuracy rates for high-dimensional data. The proposed method employs interaction information to guide the search, sequentially adds one feature at a time into the currently selected subset, and adopts early stopping to prevent overfitting and speed up the search. Our method is dynamic and selects only relevant and irredundant features that significantly improve the accuracy rates. Our experimental results for eleven high-dimensional data sets demonstrate that our algorithm consistently outperforms prior feature selection techniques, while requiring a reasonable amount of search time.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 145, 1 April 2018, Pages 59-66
نویسندگان
,