کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
6897766 | 1446042 | 2013 | 9 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Algorithmic aspects of mean-variance optimization in Markov decision processes
ترجمه فارسی عنوان
جنبه های الگوریتمی بهینه سازی میانگین واریانس در فرآیند تصمیم گیری مارکوف
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
فرآیندهای مارکوف، برنامه نویسی دینامیک، کنترل، نظریه پیچیدگی،
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
علوم کامپیوتر (عمومی)
چکیده انگلیسی
We consider finite horizon Markov decision processes under performance measures that involve both the mean and the variance of the cumulative reward. We show that either randomized or history-based policies can improve performance. We prove that the complexity of computing a policy that maximizes the mean reward under a variance constraint is NP-hard for some cases, and strongly NP-hard for others. We finally offer pseudopolynomial exact and approximation algorithms.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: European Journal of Operational Research - Volume 231, Issue 3, 16 December 2013, Pages 645-653
Journal: European Journal of Operational Research - Volume 231, Issue 3, 16 December 2013, Pages 645-653
نویسندگان
Shie Mannor, John N. Tsitsiklis,