کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6868918 681345 2017 26 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Model free feature screening for ultrahigh dimensional data with responses missing at random
ترجمه فارسی عنوان
غربالگری ویژگی های مدل برای داده های فوق العاده ابعادی با پاسخ های تصادفی گم شده است
کلمات کلیدی
داده های فوق العاده بالا، گمشده تصادفی، غربالگری ویژگی، مطمئنا غربالگری اموال،
ترجمه چکیده
این مقاله در مورد ویژگی های غربالگری داده های فوق العاده با توجه به پاسخ هایی که به صورت تصادفی گم شده اند، مربوط می شود. روش غربالگری ویژگی آزاد براساس روش های معکوس احتمال معادله پیشنهاد شده است، که در آن روش فیلتر کلموگروف برای نمایش ویژگی های مهم تحت تابع امتیاز نامطلوب ناشناخته استفاده می شود. روش غربالگری پیشنهادی دارای مزایای مطلوب است. اولا، این ویژگی دارای توزیع قدرتمند به توده های سنگین پیش بینی کننده ها و وجود بالقوه بالقوه است. دوم، این یک روش مدل رایگان با مفروضات مدل خفیف است. سوم اینکه می توان با مشکل داده های از دست رفته با پاسخ هایی که به صورت تصادفی گم شده اند مقابله کند. مطالعات شبیه سازی مونت کارلو برای بررسی عملکرد روش پیشنهادی انجام شده است و یک نرم افزار واقعی داده نیز برای ارزیابی و نشان دادن روش های پیشنهادی ارائه شده است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
The paper concerns the feature screening for the ultrahigh dimensional data with responses missing at random. A model free feature screening procedure based on the inverse probability weighted methods has been proposed, where the Kolmogorov filter method is used to screen the important features under an unknown propensity score function. The suggested screening procedure has several desirable advantages. First, it has property of robust to heavy-tailed distributions of predictors and the presence of potential outliers. Second, it is a model free procedure with mild model assumptions. Third, it can deal with the missing data problem with responses missing at random. Monte Carlo simulation studies are conducted to examine the performance of the proposed procedure and a real data application is also conducted to evaluate and illustrate the proposed methods.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 105, January 2017, Pages 201-216
نویسندگان
, , , ,