دانلود رایگان مقاله: الگوریتم بهینه یادگیری آنلاین برای افق های نهایی برای بازی های غیر صفر با پویایی ناشناخته و ورودی محدود

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
6865470	679032	2016	8 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Online finite-horizon optimal learning algorithm for nonzero-sum games with partially unknown dynamics and constrained inputs

ترجمه فارسی عنوان

الگوریتم بهینه یادگیری آنلاین برای افق های نهایی برای بازی های غیر صفر با پویایی ناشناخته و ورودی محدود

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

افق محدود بازی های غیر رقابتی، شبکه عصبی، برنامه ریزی پویا سازگار،

adaptive dynamic programming - برنامه ریزی پویا تطبیقی Neural network - شبکه عصبی

موضوعات مرتبط

مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی

پیش نمایش مقاله

الگوریتم بهینه یادگیری آنلاین برای افق های نهایی برای بازی های غیر صفر با پویایی ناشناخته و ورودی محدود

چکیده انگلیسی

In this paper, an online optimal learning algorithm based on adaptive dynamic programming (ADP) approach is designed to solve the finite-horizon optimal control for multi-player nonzero-sum games with partially unknown dynamics and constrained control inputs. Firstly, it is proved that the online policy iteration (PI) algorithm is equivalent to Newton×³s iteration. Secondly, the single neural networks (NNs) with time-varying activation functions for each player are used to approximate the time-varying solution to the coupled Hamilton-Jacobi-Bellman (HJB) equations in an online and forward-in-time manner. Control constraints are handled through non-quadratic functions. The convergence of NN-based online optimal learning algorithm for the multi-player nonzero-sum games is also proved. Finally, a simulation example illustrates the effectiveness of the proposed algorithm.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 185, 12 April 2016, Pages 37-44

نویسندگان

Xiaohong Cui, Huaguang Zhang, Yanhong Luo, Peifu Zu,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : الگوریتم بهینه یادگیری آنلاین برای افق های نهایی برای بازی های غیر صفر با پویایی ناشناخته و ورودی محدود

دسترسی سریع

ارتباط

English Website