کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
751933 1462304 2016 6 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A constrained optimization perspective on actor–critic algorithms and application to network routing
ترجمه فارسی عنوان
چشم انداز بهینه سازی محدود در الگوریتم های بازیگر منتقد و برنامه کاربردی برای مسیریابی شبکه
کلمات کلیدی
الگوریتم بازیگر ، منتقد؛ یادگیری تقویتی؛ بهینه سازی محدود
موضوعات مرتبط
مهندسی و علوم پایه سایر رشته های مهندسی کنترل و سیستم های مهندسی
چکیده انگلیسی

We propose a novel actor–critic algorithm with guaranteed convergence to an optimal policy for a discounted reward Markov decision process. The actor incorporates a descent direction that is motivated by the solution of a certain non-linear optimization problem. We also discuss an extension to incorporate function approximation and demonstrate the practicality of our algorithms on a network routing application.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Systems & Control Letters - Volume 92, June 2016, Pages 46–51
نویسندگان
, , , ,