کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
708808 | 892034 | 2016 | 6 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
A Generalization of Robust Normal Two-Armed Bandit*
ترجمه فارسی عنوان
تشریح یک رقیب معمولی دو ریش تراش *
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
مشکل دزدی دو مسلح کنترل در محیط تصادفی، مینیمکس و رویکردهای بیزی، پردازش گروه، یک قضیه مینیمکس متضاد
موضوعات مرتبط
مهندسی و علوم پایه
سایر رشته های مهندسی
مکانیک محاسباتی
چکیده انگلیسی
We consider Normal two-armed bandit problem with a priori known variances and unknown mathematical expectations of incomes in robust (minimax) setting. This setup naturally arises in group control of data processing. We show that one can solve the problem using the main theorem of the theory of games, i.e. determine minimax strategy and minimax risk as Bayesian corresponding to the worst-case prior distribution. We obtain recursive invariant Bellman-type equation for calculation appropriate Bayesian risk and Bayesian strategy. The requirement of a priori known variances of incomes may be omitted because they may be estimated at the initial stage of control.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: IFAC-PapersOnLine - Volume 49, Issue 13, 2016, Pages 247–252
Journal: IFAC-PapersOnLine - Volume 49, Issue 13, 2016, Pages 247–252
نویسندگان
Alexander V. Kolnogorov,