کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
695396 1460657 2015 4 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Random search for constrained Markov decision processes with multi-policy improvement
ترجمه فارسی عنوان
جستجوی تصادفی برای محدودیت فرآیند تصمیم گیری مارکوف با بهبود چند سیاست
کلمات کلیدی
فرایندهای تصمیم گیری مارکوف، جستجوی تصادفی، بهبود سیاست، بهینه سازی محدود،
موضوعات مرتبط
مهندسی و علوم پایه سایر رشته های مهندسی کنترل و سیستم های مهندسی
چکیده انگلیسی
This communique first presents a novel multi-policy improvement method which generates a feasible policy at least as good as any policy in a given set of feasible policies in finite constrained Markov decision processes (CMDPs). A random search algorithm for finding an optimal feasible policy for a given CMDP is derived by properly adapting the improvement method. The algorithm alleviates the major drawback of solving unconstrained MDPs at iterations in the existing value-iteration and policy-iteration type exact algorithms. We establish that the sequence of feasible policies generated by the algorithm converges to an optimal feasible policy with probability one and has a probabilistic exponential convergence rate.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Automatica - Volume 58, August 2015, Pages 127-130
نویسندگان
,