کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
751933 | 1462304 | 2016 | 6 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
A constrained optimization perspective on actor–critic algorithms and application to network routing
ترجمه فارسی عنوان
چشم انداز بهینه سازی محدود در الگوریتم های بازیگر منتقد و برنامه کاربردی برای مسیریابی شبکه
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
الگوریتم بازیگر ، منتقد؛ یادگیری تقویتی؛ بهینه سازی محدود
موضوعات مرتبط
مهندسی و علوم پایه
سایر رشته های مهندسی
کنترل و سیستم های مهندسی
چکیده انگلیسی
We propose a novel actor–critic algorithm with guaranteed convergence to an optimal policy for a discounted reward Markov decision process. The actor incorporates a descent direction that is motivated by the solution of a certain non-linear optimization problem. We also discuss an extension to incorporate function approximation and demonstrate the practicality of our algorithms on a network routing application.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Systems & Control Letters - Volume 92, June 2016, Pages 46–51
Journal: Systems & Control Letters - Volume 92, June 2016, Pages 46–51
نویسندگان
Prashanth L.A., Prasad H.L., Shalabh Bhatnagar, Prakash Chandra,