کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
7377246 1480111 2016 5 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
On the Bellman's principle of optimality
ترجمه فارسی عنوان
در اصل بهینه بودن بلمن
ترجمه چکیده
معادله بلمن به طور گسترده ای در حل مشکلات کنترل بهینه تصادفی در انواع برنامه های کاربردی از جمله برنامه ریزی سرمایه گذاری، مشکلات برنامه ریزی و مسائل مسیریابی استفاده می شود. بر اساس فرآیند تصمیم گیری مارکوف برای سیاست های ثابت، ما اثبات جدیدی برای معادله بلمن برای بهینه سازی ارائه می کنیم. اثبات ما بر این اساس در دسترس بودن یک مدل صریح محیطی است که تجربیات احتمالی گذار و هزینه های مرتبط را در بر می گیرد.
موضوعات مرتبط
مهندسی و علوم پایه ریاضیات فیزیک ریاضی
چکیده انگلیسی
Bellman's equation is widely used in solving stochastic optimal control problems in a variety of applications including investment planning, scheduling problems and routing problems. Building on Markov decision processes for stationary policies, we present a new proof for Bellman's equation of optimality. Our proof rests its case on the availability of an explicit model of the environment that embodies transition probabilities and associated costs.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Physica A: Statistical Mechanics and its Applications - Volume 462, 15 November 2016, Pages 217-221
نویسندگان
,