کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4949361 1440047 2017 16 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Uncertainty-safe large scale support vector machines
ترجمه فارسی عنوان
دستگاه های بردار پشتیبانی از عدم اطمینان ایمن در مقیاس بزرگ
کلمات کلیدی
ترجمه چکیده
مسئله طبقه بندی دوتایی در مقیاس بزرگ زمانی که داده ها به اختلالات تصادفی منجر می شود، مورد توجه قرار گرفته است. مدل پیشنهادی یک چارچوب یادگیری را ایجاد می کند که استحکام آن را در برابر نویز در طول یادگیری تنظیم می کند. این روش از موقعیت های محافظه کارانه جلوگیری می کند که می تواند با فرمولبندی ماشین های برنده پشتیبانی قوی بدترین حالت مواجه شود. الگوریتم را می توان به عنوان یک روش برای یادگیری مجموعه پشتیبانی از توزیع نویز در طول فرایند آموزش دیده است. این امر با معرفی متغیرهای بهینه سازی شده که میزان بروز اختلالات نویز را کنترل می کنند، باید مورد توجه قرار گیرد. این مقدار با بهینه سازی یک خطای عمومی، تنظیم می شود. تنها تخمین های نادرست مرزهای اختلال لازم است. علاوه بر این، یک روش بهینه سازی دو مرحله ای تصادفی برای حل این فرمول پیشنهاد شده است. این الگوریتم حرکت بسیار گرانبهای تصادفی بسیار ارزان را انجام می دهد و بنابراین به مجموعه داده های بزرگ مناسب است. تشویق نتایج تجربی نشان می دهد که این تکنیک از فرمولاسیون های برنامه نویسی مخروطی قوی با ثبات برخوردار است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
The issue of large scale binary classification when data is subject to random perturbations is addressed. The proposed model integrates a learning framework that adjusts its robustness to noise during learning. The method avoids over-conservative situations that can be encountered with worst-case robust support vector machine formulations. The algorithm could be seen as a technique to learn the support-set of the noise distribution during the training process. This is achieved by introducing optimization variables that control the magnitude of the noise perturbations that should be taken into account. The magnitude is tuned by optimizing a generalization error. Only rough estimates of perturbations bounds are required. Additionally, a stochastic bi-level optimization technique is proposed to solve the resulting formulation. The algorithm performs very cheap stochastic subgradient moves and is therefore well suited to large datasets. Encouraging experimental results show that the technique outperforms robust second order cone programming formulations.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 109, May 2017, Pages 215-230
نویسندگان
, ,