کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
413346 | 680420 | 2006 | 11 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Navigation with memory in a partially observable environment
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
پیش نمایش صفحه اول مقاله
چکیده انگلیسی
The paper presents an architecture that allows the reactive visual navigation via an unsupervised reinforcement learning. This objective is reached using QQ-learning and a hierarchical approach to the developed architecture. Using these techniques requires a deviation from the Partially Observable Markov Decision Processes (POMDP) and some innovations: heuristic techniques for generalizing the experience and for treating the partial observability; a technique for the speed adjournment of the QQ function; the definition of a special reinforcement policy adequate for learning a complex task without supervision. The result is a satisfactory learning of the navigation assignment in a simulated environment.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Robotics and Autonomous Systems - Volume 54, Issue 1, 31 January 2006, Pages 84–94
Journal: Robotics and Autonomous Systems - Volume 54, Issue 1, 31 January 2006, Pages 84–94
نویسندگان
A. Montesanto, G. Tascini, P. Puliti, P. Baldassarri,