کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6868614 1440029 2018 19 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Robust and parallel Bayesian model selection
ترجمه فارسی عنوان
انتخاب مدل قوی و موازی بیزی
کلمات کلیدی
فراگیری ماشین، آمار بیزی، انتخاب مدل، استنتاج مقیاس پذیر،
ترجمه چکیده
انتخاب مدل موثر و دقیق یک مشکل مهم در تحلیل داده های مدرن است. یکی از چالش های عمده، بار محاسباتی مورد نیاز برای رسیدگی به مجموعه های داده های بزرگ است که نمی توانند در یک دستگاه ذخیره یا پردازش شوند. یکی دیگر از چالش هایی که ممکن است با آن روبرو شود، وجود آلودگی ها و آلودگی ها است که به کیفیت استنباط آسیب می رساند. موازی؟ تقسیم و فتح؟ استراتژی انتخاب مدل مشاهدات مجموعه داده های کامل را به زیر مجموعه های تقریبا مساوی تقسیم می کند و نتیجه گیری و انتخاب مدل را به طور مستقل در هر زیر مجموعه انجام می دهد. پس از استنتاج زیرمجموعه محلی، این روش، احتمال احتمالی مدل خلفی یا سایر معیارهای انتخاب مدل / متغیر را برای بدست آوردن مدل نهایی با استفاده از مفهوم هندسی هندسی جمع می کند. این روش منجر به بهبود تمرکز در پیدا کردن یک اصلاح پارامترهای مدل و مدل و همچنین به طور قابل ملاحظه ای از آلودگی داده ها و آلودگی اطلاعاتی برخوردار است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
Effective and accurate model selection is an important problem in modern data analysis. One of the major challenges is the computational burden required to handle large datasets that cannot be stored or processed on one machine. Another challenge one may encounter is the presence of outliers and contaminations that damage the inference quality. The parallel “divide and conquer” model selection strategy divides the observations of the full dataset into roughly equal subsets and perform inference and model selection independently on each subset. After local subset inference, this method aggregates the posterior model probabilities or other model/variable selection criteria to obtain a final model by using the notion of geometric median. This approach leads to improved concentration in finding the “correct” model and model parameters and also is provably robust to outliers and data contamination.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 127, November 2018, Pages 229-247
نویسندگان
, , ,