A policy improvement method for constrained average Markov decision processes

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
1143085	957177	2007	5 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

Policy improvement Policy iteration - تکرار سیاست

موضوعات مرتبط

مهندسی و علوم پایه ریاضیات ریاضیات گسسته و ترکیبات

پیش نمایش صفحه اول مقاله

A policy improvement method for constrained average Markov decision processes

چکیده انگلیسی

This brief paper presents a policy improvement method for constrained Markov decision processes (MDPs) with average cost criterion under an ergodicity assumption, extending Howard's policy improvement for MDPs. The improvement method induces a policy iteration-type algorithm that converges to a local optimal policy.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Operations Research Letters - Volume 35, Issue 4, July 2007, Pages 434–438

نویسندگان

Hyeong Soo Chang,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

A policy improvement method for constrained average Markov decision processes

دسترسی سریع

ارتباط

English Website