دانلود رایگان مقاله: یک الگوریتم جستجو دقیق تکرار برای فرآیندهای تصمیم گیری محدود مارکوف

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
696311	890331	2014	4 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

An exact iterative search algorithm for constrained Markov decision processes

ترجمه فارسی عنوان

یک الگوریتم جستجو دقیق تکرار برای فرآیندهای تصمیم گیری محدود مارکوف

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

فرایندهای تصمیم گیری مارکوف، تکرار سیاست، برنامه نویسی دینامیک، بهینه سازی محدود

Dynamic programming - برنامه‌ریزی پویا یا برنامه‌ نویسی پویا Constrained optimization - بهینه سازی محدود Policy iteration - تکرار سیاست Markov decision processes - پروسه تصمیم گیری مارکوف

موضوعات مرتبط

مهندسی و علوم پایه سایر رشته های مهندسی کنترل و سیستم های مهندسی

پیش نمایش مقاله

یک الگوریتم جستجو دقیق تکرار برای فرآیندهای تصمیم گیری محدود مارکوف

چکیده انگلیسی

This communique provides an exact iterative search algorithm for the NP-hard problem of obtaining an optimal feasible stationary Markovian pure policy that achieves the maximum value averaged over an initial state distribution in finite constrained Markov decision processes. It is based on a novel characterization of the entire feasible policy space and takes the spirit of policy iteration (PI) in that a sequence of monotonically improving feasible policies is generated and converges to an optimal policy in iterations of the size of the policy space at the worst case. Unlike PI, an unconstrained MDP needs to be solved at iterations involved with feasible policies and the current best policy improves all feasible policies included in the union of the policy spaces associated with the unconstrained MDPs.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Automatica - Volume 50, Issue 5, May 2014, Pages 1531–1534

نویسندگان

Hyeong Soo Chang,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : یک الگوریتم جستجو دقیق تکرار برای فرآیندهای تصمیم گیری محدود مارکوف

دسترسی سریع

ارتباط

English Website