دانلود رایگان مقاله: الگوریتمهای فراگشت اولویت بندی شده دوره یادگیری دراماتیک است

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
11012480	1798846	2018	28 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Epoch-incremental Dyna-learning and prioritized sweeping algorithms

ترجمه فارسی عنوان

الگوریتمهای فراگشت اولویت بندی شده دوره یادگیری دراماتیک است

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

جستجوی اولیه بت دینا یادگیری، حالت افزایشی دوره ای، ارزیابی اولویت بندی شده، تقویت یادگیری،

breadth-first search - جستجوی اولویت اول Reinforcement learning - یادگیری تقویتی

موضوعات مرتبط

مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی

پیش نمایش مقاله

الگوریتمهای فراگشت اولویت بندی شده دوره یادگیری دراماتیک است

چکیده انگلیسی

Dyna-learning and prioritized sweeping (PS in short) are the most commonly used reinforcement learning algorithms which use the model of the environment. In this paper, the modified versions of these algorithms are presented. The modification exploits the breadth-first search (BFS) to conduct additional modifications of the policy in the epoch mode. The experiments, which are performed in the dynamic grid world and in the ball-beam system, showed that the proposed modifications improved the efficiency of the reinforcement learning algorithms.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 319, 30 November 2018, Pages 13-20

نویسندگان

Roman Zajdel,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : الگوریتمهای فراگشت اولویت بندی شده دوره یادگیری دراماتیک است

دسترسی سریع

ارتباط

English Website