کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
478111 1446022 2014 11 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Convergence of controlled models and finite-state approximation for discounted continuous-time Markov decision processes with constraints
ترجمه فارسی عنوان
همگرایی مدل های کنترل شده و نزدیک بودن تقریبی حالت برای فرآیندهای تصمیم گیری مستمر بر اساس تصمیم گیری مارکوف با محدودیت ها
کلمات کلیدی
فرآیندهای تصدیق مارکف پیوسته محدود شده، نرخ انتقال بدون محدودیت، همگرایی، تقریب نهایی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی


• Convergence of the optimal values for discounted constrained continuous-time Markov decision processes (CTMDP).
• Convergence of optimal policies for discounted constrained CTMDP.
• Finite-state approximation to countable-state discounted constrained CTMDP.
• Applied examples and convergence rates.

In this paper we consider the convergence of a sequence {Mn}{Mn} of the models of discounted continuous-time constrained   Markov decision processes (MDP) to the “limit” one, denoted by M∞M∞. For the models with denumerable states and unbounded transition rates, under reasonably mild conditions we prove that the (constrained) optimal policies and the optimal values of {Mn}{Mn} converge to those of M∞M∞, respectively, using a technique of occupation measures. As an application of the convergence result developed here, we show that an optimal policy and the optimal value for countable-state continuous-time MDP can be approximated by those of finite-state continuous-time MDP. Finally, we further illustrate such finite-state approximation by solving numerically a controlled birth-and-death system and also give the corresponding error bound of the approximation.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: European Journal of Operational Research - Volume 238, Issue 2, 16 October 2014, Pages 486–496
نویسندگان
, ,