کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4949387 1440048 2017 18 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Tracking concept drift using a constrained penalized regression combiner
ترجمه فارسی عنوان
ردیابی مفهوم ردیابی با استفاده از ترکیبی از رگرسیون مجاز محدود شده
کلمات کلیدی
ترجمه چکیده
هدف از این کار توسعه یک مدل پیش بینی زمانی است که دسته های داده ها به صورت متوالی جمع آوری می شوند. با داده های جریان داده، اطلاعات به طور مداوم در حال به روز رسانی است و یک چالش عمده آماری برای این نوع داده ها این است که توزیع اساسی و وابستگی واقعی ورودی / خروجی ممکن است در طول زمان تغییر کند، یک پدیده شناخته شده به عنوان مفهوم رانش. پدیده رانش مفهوم، فرایند یادگیری را پیچیده می کند، زیرا یک مدل پیش بینی شده بر روی داده های گذشته دیگر با نمونه های جدید سازگار نیست. به منظور ردیابی مفهوم مؤثر، ما روشهای ترکیبی مدل را با استفاده از رگرسیون محدود و مجاز ارائه می دهیم که دارای ویژگی گروه بندی است. روش های یادگیری جدید ما را قادر می سازد دسته های داده ها را به عنوان گروهی که مربوط به فعلی هستند انتخاب کنیم، اثرات دسته های نامناسب را کاهش دهیم و انطباق نشان دهنده میزان راندگی مفهوم در جریان داده ها باشد. ما نمونه عملکرد محدودی از روش پیشنهاد شده را با استفاده از نمونه های شبیه سازی شده و واقعی نشان می دهیم. نتایج تحلیلی و تجربی نشان می دهد که روش های پیشنهادی می توانند به طور موثر با انواع مختلف مفهوم ریزش سازگار شوند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
The objective of this work is to develop a predictive model when data batches are collected in a sequential manner. With streaming data, information is constantly being updated and a major statistical challenge for these types of data is that the underlying distribution and the true input-output dependency might change over time, a phenomenon known as concept drift. The concept drift phenomenon makes the learning process complicated because a predictive model constructed on the past data is no longer consistent with new examples. In order to effectively track concept drift, we propose model-combining methods using constrained and penalized regression that possesses a grouping property. The new learning methods enable us to select data batches as a group that are relevant to the current one, reduce the effects of irrelevant batches, and adaptively reflect the degree of concept drift emerging in data streams. We demonstrate the finite sample performance of the proposed method using simulated and real examples. The analytical and empirical results indicate that the proposed methods can effectively adapt to various types of concept drift.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 108, April 2017, Pages 52-69
نویسندگان
, , , ,