کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6869448 681363 2016 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Adaptive conditional feature screening
ترجمه فارسی عنوان
غربالگری ویژگی های انطباق پذیر
کلمات کلیدی
داده های با ابعاد بزرگ، مدل رایگان غربالگری مشروط، سازگاری، ابزار حاشیه ای،
ترجمه چکیده
هنگامی که همبستگی بین پیش بینی کننده ها نسبتا قوی و / یا ساختار مدل نمی تواند مشخص شود، ساخت و ساز از غربالگری ویژگی های تطبیقی ​​مسئله چالش برانگیز باقی مانده است. یک روش عمومی از غربالگری ویژگی های شرطی از طریق ترکیب یک ویژگی غربالگری بدون مدل با یک پیش تعیین کننده از پیش تعیین شده پیشنهاد می شود. روش متمرکز پیشنهاد شده می تواند بخش ناعادلانه را از معیار ویژگی غربالگری ویژگی های مدل حذف کند. در نتیجه، معیار جدید می تواند ابزارهای حاشیه ای پیش بینی های مشروط بر مجموعه پیش بینی کننده پیش بینی شده را اندازه گیری کند. اطلاعات شرطی در مورد این پیش بینی های پیش تعیین شده کمک می کند تا همبستگی بین متغیرها را کاهش دهد و به این ترتیب روش نتیجه می تواند منفی کاذب مثبت و منفی کاذب را در روش انتخاب متغیر کاهش دهد. بدین ترتیب، روش ما سازگار با هر دو همبستگی بین متغیرها و ناسازگاری مدل است. روش های جدید به صورت محاسباتی کارآمد و ساده هستند و می توانند به سایر روش های مرتبط گسترش پیدا کنند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
When the correlation among the predictors is relatively strong and/or the model structures cannot be specified, the construction of adaptive feature screening remains a challenging issue. A general technique of conditional feature screening is proposed via combining a model-free feature screening with a predetermined set of predictors. The proposed centralization technique can remove the irrelevant part from the criterion of the model-free feature screening. Consequently, the new criterion can measure the marginal utilities of predictors conditional on the predetermined set of predictors. The conditional information about these predetermined predictors helps reducing the correlation among covariates and as a result the resulting method can reduce the false positive and the false negative rates in the variable selection procedure. Thus, our method is adaptive to both the correlation among the covariates and the model misspecification. The new procedures are computationally efficient and simple, and can be extended to other relevant methods.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 94, February 2016, Pages 287-301
نویسندگان
, ,