Bias optimality for multichain continuous-time Markov decision processes

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
1143393	957199	2009	5 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

Policy iteration - تکرار سیاست

موضوعات مرتبط

مهندسی و علوم پایه ریاضیات ریاضیات گسسته و ترکیبات

پیش نمایش صفحه اول مقاله

Bias optimality for multichain continuous-time Markov decision processes

چکیده انگلیسی

This paper deals with the bias optimality of multichain models for finite continuous-time Markov decision processes. Based on new performance difference formulas developed here, we prove the convergence of a so-called bias-optimal policy iteration algorithm, which can be used to obtain bias-optimal policies in a finite number of iterations.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Operations Research Letters - Volume 37, Issue 5, September 2009, Pages 317-321

نویسندگان

Xianping Guo, XinYuan Song, Junyu Zhang,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

Bias optimality for multichain continuous-time Markov decision processes

دسترسی سریع

ارتباط

English Website