کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6897963 1446050 2013 9 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Accelerating the convergence of value iteration by using partial transition functions
ترجمه فارسی عنوان
تسریع همگرایی تکرار ارزش با استفاده از توابع انتقال جزئی
کلمات کلیدی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
► We introduce a Partial Information Value Iteration (PIVI) algorithm for MDPs. ► The algorithm employs increasingly accurate approximate models. ► We apply an optimal model update schedule in terms of overall computational effort. ► Examples illustrate the properties of the proposed algorithm.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: European Journal of Operational Research - Volume 229, Issue 1, 16 August 2013, Pages 190-198
نویسندگان
, , , ,