Time aggregated Markov decision processes via standard dynamic programming

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
1143316	957191	2011	5 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

Dynamic programming - برنامه‌ریزی پویا یا برنامه‌ نویسی پویا Time aggregation - تجمع زمان Markov decision processes - پروسه تصمیم گیری مارکوف

موضوعات مرتبط

مهندسی و علوم پایه ریاضیات ریاضیات گسسته و ترکیبات

پیش نمایش صفحه اول مقاله

Time aggregated Markov decision processes via standard dynamic programming

چکیده انگلیسی

This note addresses the time aggregation approach to ergodic finite state Markov decision processes with uncontrollable states. We propose the use of the time aggregation approach as an intermediate step toward constructing a transformed MDP whose state space is comprised solely of the controllable states. The proposed approach simplifies the iterative search for the optimal solution by eliminating the need to define an equivalent parametric function, and results in a problem that can be solved by simpler, standard MDP algorithms.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Operations Research Letters - Volume 39, Issue 3, May 2011, Pages 193–197

نویسندگان

Edilson F. Arruda, Marcelo D. Fragoso,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

Time aggregated Markov decision processes via standard dynamic programming

دسترسی سریع

ارتباط

English Website