دانلود رایگان مقاله: چشم انداز بهینه سازی محدود در الگوریتم های بازیگر منتقد و برنامه کاربردی برای مسیریابی شبکه

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
751933	1462304	2016	6 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

A constrained optimization perspective on actor–critic algorithms and application to network routing

ترجمه فارسی عنوان

چشم انداز بهینه سازی محدود در الگوریتم های بازیگر منتقد و برنامه کاربردی برای مسیریابی شبکه

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

الگوریتم بازیگر ، منتقد؛ یادگیری تقویتی؛ بهینه سازی محدود

Constrained optimization - بهینه سازی محدود Reinforcement learning - یادگیری تقویتی

موضوعات مرتبط

مهندسی و علوم پایه سایر رشته های مهندسی کنترل و سیستم های مهندسی

پیش نمایش مقاله

چشم انداز بهینه سازی محدود در الگوریتم های بازیگر منتقد و برنامه کاربردی برای مسیریابی شبکه

چکیده انگلیسی

We propose a novel actor–critic algorithm with guaranteed convergence to an optimal policy for a discounted reward Markov decision process. The actor incorporates a descent direction that is motivated by the solution of a certain non-linear optimization problem. We also discuss an extension to incorporate function approximation and demonstrate the practicality of our algorithms on a network routing application.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Systems & Control Letters - Volume 92, June 2016, Pages 46–51

نویسندگان

Prashanth L.A., Prasad H.L., Shalabh Bhatnagar, Prakash Chandra,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : چشم انداز بهینه سازی محدود در الگوریتم های بازیگر منتقد و برنامه کاربردی برای مسیریابی شبکه

دسترسی سریع

ارتباط

English Website