کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
1143085 957177 2007 5 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A policy improvement method for constrained average Markov decision processes
موضوعات مرتبط
مهندسی و علوم پایه ریاضیات ریاضیات گسسته و ترکیبات
پیش نمایش صفحه اول مقاله
A policy improvement method for constrained average Markov decision processes
چکیده انگلیسی

This brief paper presents a policy improvement method for constrained Markov decision processes (MDPs) with average cost criterion under an ergodicity assumption, extending Howard's policy improvement for MDPs. The improvement method induces a policy iteration-type algorithm that converges to a local optimal policy.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Operations Research Letters - Volume 35, Issue 4, July 2007, Pages 434–438
نویسندگان
,