کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
695396 | 1460657 | 2015 | 4 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Random search for constrained Markov decision processes with multi-policy improvement
ترجمه فارسی عنوان
جستجوی تصادفی برای محدودیت فرآیند تصمیم گیری مارکوف با بهبود چند سیاست
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
فرایندهای تصمیم گیری مارکوف، جستجوی تصادفی، بهبود سیاست، بهینه سازی محدود،
موضوعات مرتبط
مهندسی و علوم پایه
سایر رشته های مهندسی
کنترل و سیستم های مهندسی
چکیده انگلیسی
This communique first presents a novel multi-policy improvement method which generates a feasible policy at least as good as any policy in a given set of feasible policies in finite constrained Markov decision processes (CMDPs). A random search algorithm for finding an optimal feasible policy for a given CMDP is derived by properly adapting the improvement method. The algorithm alleviates the major drawback of solving unconstrained MDPs at iterations in the existing value-iteration and policy-iteration type exact algorithms. We establish that the sequence of feasible policies generated by the algorithm converges to an optimal feasible policy with probability one and has a probabilistic exponential convergence rate.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Automatica - Volume 58, August 2015, Pages 127-130
Journal: Automatica - Volume 58, August 2015, Pages 127-130
نویسندگان
Hyeong Soo Chang,