کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
1143393 957199 2009 5 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Bias optimality for multichain continuous-time Markov decision processes
موضوعات مرتبط
مهندسی و علوم پایه ریاضیات ریاضیات گسسته و ترکیبات
پیش نمایش صفحه اول مقاله
Bias optimality for multichain continuous-time Markov decision processes
چکیده انگلیسی
This paper deals with the bias optimality of multichain models for finite continuous-time Markov decision processes. Based on new performance difference formulas developed here, we prove the convergence of a so-called bias-optimal policy iteration algorithm, which can be used to obtain bias-optimal policies in a finite number of iterations.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Operations Research Letters - Volume 37, Issue 5, September 2009, Pages 317-321
نویسندگان
, , ,