کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
1142229 957137 2016 6 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Improved bound on the worst case complexity of Policy Iteration
ترجمه فارسی عنوان
کران بهبودیافته در بدترین پیچیدگی مورد تکرار سیاست
کلمات کلیدی
سیاست اصلاح؛ پیچیدگی؛ فرایند تصمیم مارکوف؛ جهت گیری سینک بدون دور منحصر به فرد
موضوعات مرتبط
مهندسی و علوم پایه ریاضیات ریاضیات گسسته و ترکیبات
چکیده انگلیسی

Solving Markov Decision Processes is a recurrent task in engineering which can be performed efficiently in practice using the Policy Iteration algorithm. Regarding its complexity, both lower and upper bounds are known to be exponential (but far apart) in the size of the problem. In this work, we provide the first improvement over the now standard upper bound from Mansour and Singh (1999). We also show that this bound is tight for a natural relaxation of the problem.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Operations Research Letters - Volume 44, Issue 2, March 2016, Pages 267–272
نویسندگان
, , , ,