کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4943454 | 1437630 | 2017 | 11 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Comprehensive study of feature selection methods to solve multicollinearity problem according to evaluation criteria
ترجمه فارسی عنوان
بررسی جامع از روش های انتخاب ویژگی برای حل مشکل چند قطبی با توجه به معیارهای ارزیابی
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
اتصالات داده، انتخاب ویژگی، چندین همبستگی، برنامه نویسی درجه یک، معیارهای ارزیابی، مجموعه داده های تست،
ترجمه چکیده
این مقاله روشی جدید برای انتخاب ویژگی بر مبنای مفهوم فیلترهای ویژگی فراهم می کند، به طوری که انتخاب ویژگی مستقل از مدل پیش بینی است. اتصالات داده به عنوان یک مسئله بهینه سازی یک هدف مشخص شده است، جایی که تابع هدف نشان دهنده خطای تقریب بردار هدف به عنوان برخی از عملکرد از ویژگی های داده شده است. وابستگی خطی بین ویژگی ها منجر به مشکل چند زاویه ای می شود و منجر به بی ثباتی مدل و افزونگی مجموعه ویژگی می شود. این مقاله یک روش انتخاب ویژگی بر اساس برنامه نویسی درجه دوم را معرفی می کند. این رویکرد، وابستگی متقابل ویژگی ها و بردار هدف را در نظر می گیرد و ویژگی ها را با توجه به مقیاس های مرتبط و تشابه که با توجه به مشکل خاص مشخص می شود، انتخاب می کند. ایده اصلی این است که به حداقل رساندن وابستگی متقابل و به حداکثر رساندن کیفیت تقریبی با تغییر یک بردار دودویی که نشان دهنده حضور ویژگی ها است. مدل انتخاب شده کمتر از حد معمول و پایدار است. برای ارزیابی کیفیت روش انتخاب ویژگی پیشنهاد شده و مقایسه آن با دیگران، از معیارهای مختلفی برای اندازه گیری بی ثباتی و اضافه کاری استفاده می کنیم. در آزمایشات ما رویکرد پیشنهادی را با چندین روش انتخاب دیگر ویژگی مقایسه می کنیم و نشان می دهیم که رویکرد برنامه نویسی درجه یک با توجه به معیارهای در نظر گرفته شده برای آزمون و مجموعه داده های واقعی، نتایج برتر ارائه می دهد.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
This paper provides a new approach to feature selection based on the concept of feature filters, so that feature selection is independent of the prediction model. Data fitting is stated as a single-objective optimization problem, where the objective function indicates the error of approximating the target vector as some function of given features. Linear dependence between features induces the multicollinearity problem and leads to instability of the model and redundancy of the feature set. This paper introduces a feature selection method based on quadratic programming. This approach takes into account the mutual dependence of the features and the target vector, and selects features according to relevance and similarity measures defined according to the specific problem. The main idea is to minimize mutual dependence and maximize approximation quality by varying a binary vector that indicates the presence of features. The selected model is less redundant and more stable. To evaluate the quality of the proposed feature selection method and compare it with others, we use several criteria to measure instability and redundancy. In our experiments, we compare the proposed approach with several other feature selection methods, and show that the quadratic programming approach gives superior results according to the criteria considered for the test and real data sets.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 76, 15 June 2017, Pages 1-11
Journal: Expert Systems with Applications - Volume 76, 15 June 2017, Pages 1-11
نویسندگان
Alexandr Katrutsa, Vadim Strijov,