دانلود رایگان مقاله: جستجوی تصادفی برای محدودیت فرآیند تصمیم گیری مارکوف با بهبود چند سیاست

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
695396	1460657	2015	4 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Random search for constrained Markov decision processes with multi-policy improvement

ترجمه فارسی عنوان

جستجوی تصادفی برای محدودیت فرآیند تصمیم گیری مارکوف با بهبود چند سیاست

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

فرایندهای تصمیم گیری مارکوف، جستجوی تصادفی، بهبود سیاست، بهینه سازی محدود،

Policy improvement Constrained optimization - بهینه سازی محدود Random search - جستجوی تصادفی Markov decision processes - پروسه تصمیم گیری مارکوف

موضوعات مرتبط

مهندسی و علوم پایه سایر رشته های مهندسی کنترل و سیستم های مهندسی

پیش نمایش مقاله

جستجوی تصادفی برای محدودیت فرآیند تصمیم گیری مارکوف با بهبود چند سیاست

چکیده انگلیسی

This communique first presents a novel multi-policy improvement method which generates a feasible policy at least as good as any policy in a given set of feasible policies in finite constrained Markov decision processes (CMDPs). A random search algorithm for finding an optimal feasible policy for a given CMDP is derived by properly adapting the improvement method. The algorithm alleviates the major drawback of solving unconstrained MDPs at iterations in the existing value-iteration and policy-iteration type exact algorithms. We establish that the sequence of feasible policies generated by the algorithm converges to an optimal feasible policy with probability one and has a probabilistic exponential convergence rate.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Automatica - Volume 58, August 2015, Pages 127-130

نویسندگان

Hyeong Soo Chang,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : جستجوی تصادفی برای محدودیت فرآیند تصمیم گیری مارکوف با بهبود چند سیاست

دسترسی سریع

ارتباط

English Website