کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
416285 681324 2015 21 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Grouped variable importance with random forests and application to multiple functional data analysis
ترجمه فارسی عنوان
اهمیت متغیر دسته بندی شده با جنگل های تصادفی و کاربرد آن در تجزیه و تحلیل داده های چند کاره
کلمات کلیدی
جنگل های تصادفی، تجزیه و تحلیل داده های عملکردی، اندازه گیری اهمیت بر مبنای گروه، انتخاب متغیر گروه
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی

The selection of grouped variables using the random forest algorithm is considered. First a new importance measure adapted for groups of variables is proposed. Theoretical insights into this criterion are given for additive regression models. Second, an original method for selecting functional variables based on the grouped variable importance measure is developed. Using a wavelet basis, it is proposed to regroup all of the wavelet coefficients for a given functional variable and use a wrapper selection algorithm with these groups. Various other groupings which take advantage of the frequency and time localization of the wavelet basis are proposed. An extensive simulation study is performed to illustrate the use of the grouped importance measure in this context. The method is applied to a real life problem coming from aviation safety.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 90, October 2015, Pages 15–35
نویسندگان
, , ,