کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
1142980 957171 2009 4 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Fast convergence to state-action frequency polytopes for MDPs
موضوعات مرتبط
مهندسی و علوم پایه ریاضیات ریاضیات گسسته و ترکیبات
پیش نمایش صفحه اول مقاله
Fast convergence to state-action frequency polytopes for MDPs
چکیده انگلیسی

In the context of finite weakly communicating Markov Decision Processes, we tackle the problem of fast convergence of state-action frequency vectors to the polytope of stationary distributions on state-action frequencies. Using unichain policies, we derive bounds on the speed of convergence which are independent of the limit points.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Operations Research Letters - Volume 37, Issue 2, March 2009, Pages 123–126
نویسندگان
,