کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4969604 | 1449975 | 2017 | 28 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
A new Unsupervised Spectral Feature Selection Method for mixed data: A filter approach
ترجمه فارسی عنوان
روش انتخاب جدید ویژگی ذخیره سازی اسپکتروم جدید برای داده های مخلوط: رویکرد فیلتر
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
انتخاب ویژگی بدون نظارت، انتخاب ویژگی طیفی، داده های مختلط، ویژگی رتبه بندی،
ترجمه چکیده
اکثر روش های غیرمسئولیت انتخاب شده در حال حاضر برای پردازش فقط مجموعه داده های عددی طراحی شده اند. بنابراین، در مسائل عملی، جایی که اشیاء تحت مطالعه از طریق ویژگی های عددی و غیر عددی (مجموعه داده های مخلوط) توصیف می شوند، این روش ها نمی توانند مستقیما اعمال شوند. در این کار، ما یک روش انتخاب جدید فیلتر کنترل نشده را پیشنهاد می کنیم که می تواند در مجموعه داده ها با هر دو ویژگی عددی و غیر عددی مورد استفاده قرار گیرد. روش پیشنهاد شده توسط انتخاب طیفی الهام گرفته شده است، با استفاده از یک هسته و یک معیار جدید ارزیابی ویژگی طیفی جدید برای اندازه گیری ارتباط ویژگی. آزمایشات بر روی مجموعه داده های مصنوعی نشان می دهد که در 99٪ موارد که ویژگی های مربوطه شناخته شده است، روش ما شناسایی و رتبه بندی ویژگی های مرتبط ترین در آغاز یک لیست مرتب شده است. علاوه بر این، روش ما در برابر روش های فیلتر ناکارآمد از روش های کنترل نشده بر روی مجموعه داده های واقعی متضاد است و روش ما در اغلب موارد به طور قابل توجهی از آنها بهتر است.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
Most of the current unsupervised feature selection methods are designed to process only numerical datasets. Therefore, in practical problems, where the objects under study are described through both numerical and non-numerical features (mixed datasets), these methods cannot be directly applied. In this work, we propose a new unsupervised filter feature selection method that can be used on datasets with both numerical and non-numerical features. The proposed method is inspired by the spectral feature selection, by using together a kernel and a new spectrum based feature evaluation measure for quantifying the feature relevance. Experiments on synthetic datasets show that in the 99% of the cases where the relevant features are known our method identifies and ranks the most relevant features at the beginning of a sorted list. Additionally, we contrast our method against state-of-the-art unsupervised filter methods over real datasets, and our method in most cases significantly outperforms them.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 72, December 2017, Pages 314-326
Journal: Pattern Recognition - Volume 72, December 2017, Pages 314-326
نویسندگان
Saúl Solorio-Fernández, José Fco. MartÃnez-Trinidad, J. Ariel Carrasco-Ochoa,