دانلود رایگان مقاله: حل متوسط تصمیم گیری های تصمیم گیری مارکوف با استفاده از الگوریتم تجمیع زمان دو فاز

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
6897022	1446015	2015	9 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Solving average cost Markov decision processes by means of a two-phase time aggregation algorithm

ترجمه فارسی عنوان

حل متوسط تصمیم گیری های تصمیم گیری مارکوف با استفاده از الگوریتم تجمیع زمان دو فاز

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

برنامه نویسی دینامیک، فرایندهای تصمیم گیری مارکوف، جاسازی تجمع زمان، کنترل بهینه تصادفی،

Dynamic programming - برنامه‌ریزی پویا یا برنامه‌ نویسی پویا Time aggregation - تجمع زمان Embedding - جاسازی Markov decision processes - پروسه تصمیم گیری مارکوف Stochastic optimal control - کنترل بهینه تصادفی

ترجمه چکیده

این مقاله روشی دو مرحلهای را برای حل هزینههای پردازش تصمیمات مارکوف به طور متوسط هزینه میکند که براساس تعبیر فضای حالت یا تجمیع زمان است. در مرحله اول، تجمع زمان برای بهینه سازی خط مشی در یک زیر مجموعه ای مشخص از فضای حالت اعمال می شود و نتیجه جدیدی برای گسترش ارزیابی به کل فضای دولت اعمال می شود. این ارزیابی سپس در مرحلۀ دوم در مرحله بهبود سیاست استفاده می شود و سپس دو مرحله پس از آن همگام سازی می شود. برخی از آزمایش های عددی نتایج را نشان می دهد.

موضوعات مرتبط

مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)

پیش نمایش مقاله

حل متوسط تصمیم گیری های تصمیم گیری مارکوف با استفاده از الگوریتم تجمیع زمان دو فاز

چکیده انگلیسی

This paper introduces a two-phase approach to solve average cost Markov decision processes, which is based on state space embedding or time aggregation. In the first phase, time aggregation is applied for policy optimization in a prescribed subset of the state space, and a novel result is applied to expand the evaluation to the whole state space. This evaluation is then used in the second phase in a policy improvement step, and the two phases are then alternated until convergence is attained. Some numerical experiments illustrate the results.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: European Journal of Operational Research - Volume 240, Issue 3, 1 February 2015, Pages 697-705

نویسندگان

E.F. Arruda, M.D. Fragoso,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : حل متوسط تصمیم گیری های تصمیم گیری مارکوف با استفاده از الگوریتم تجمیع زمان دو فاز

دسترسی سریع

ارتباط

English Website