کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4974878 | 1365552 | 2015 | 19 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Optimal scheduling for reference tracking or state regulation using reinforcement learning
ترجمه فارسی عنوان
برنامه ریزی بهینه برای ردیابی مرجع و یا تنظیم دولت با استفاده از یادگیری تقویت
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
ترجمه چکیده
مسئله کنترل بهینه از سیستم های سوئیچینگ غیرخطی مستقل با توابع هزینه افق فزاینده به منظور ردیابی یک خانواده از سیگنال های مرجع یا تنظیمات دولت ها مورد بررسی قرار گرفته است. یک طرح یادگیری تقویت ارائه شده است که راه حل را یاد می گیرد و زمان بندی بین حالت ها را در یک فرم بازخورد بدون اجرای یک دنباله حالت یا تعدادی از سوئیچینگ فراهم می کند. این کار از طریق یک روش مبتنی بر تکرار ارزش انجام می شود. همگرایی طرح یادگیری تکراری با راه حل بهینه ثابت شده است. پس از پاسخ دادن به سؤالات مختلف تحلیلی در مورد راه حل، الگوریتم یادگیری ارائه شده است. در نهایت، تجزیه و تحلیل عددی برای ارزیابی عملکرد تکنیک توسعه یافته در عمل ارائه شده است.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
پردازش سیگنال
چکیده انگلیسی
The problem of optimal control of autonomous nonlinear switching systems with infinite-horizon cost functions, for the purpose of tracking a family of reference signals or regulation of the states, is investigated. A reinforcement learning scheme is presented which learns the solution and provides scheduling between the modes in a feedback form without enforcing a mode sequence or a number of switching. This is done through a value iteration based approach. The convergence of the iterative learning scheme to the optimal solution is proved. After answering different analytical questions about the solution, the learning algorithm is presented. Finally, numerical analyses are provided to evaluate the performance of the developed technique in practice.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of the Franklin Institute - Volume 352, Issue 8, August 2015, Pages 3285-3303
Journal: Journal of the Franklin Institute - Volume 352, Issue 8, August 2015, Pages 3285-3303
نویسندگان
Ali Heydari,