دانلود رایگان مقاله: به طور موقت ویژگی های تمدید در یادگیری تقویت مبتنی بر مدل با مشاهدات جزئی

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
405820	678035	2016	12 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Temporally extended features in model-based reinforcement learning with partial observability

ترجمه فارسی عنوان

به طور موقت ویژگی های تمدید در یادگیری تقویت مبتنی بر مدل با مشاهدات جزئی

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

تقویت یادگیری، یادگیری مدل، یادگیری ویژگی مشاهده قابل مشاهده بودن جزئی فرآیند تصمیم گیری مارکوف به طور جزئی قابل مشاهده است. فرایند تصمیم گیری غیر مارکوف

Partial observability - رعایت جزئی Partially observable Markov decision process - روند تصمیم گیری مارکوف به طور جزئی قابل مشاهده است Reinforcement learning - یادگیری تقویتی Model learning - یادگیری مدل Feature learning - یادگیری ویژگی

موضوعات مرتبط

مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی

پیش نمایش مقاله

به طور موقت ویژگی های تمدید در یادگیری تقویت مبتنی بر مدل با مشاهدات جزئی

چکیده انگلیسی

Partial observability poses a major challenge for a reinforcement learning agent since the complete history of observations may be relevant for predicting and acting optimally. This is especially true in the general case where the underlying state space and dynamics are unknown. Existing approaches either try to learn a latent state representation or use decision trees based on the history of observations. In this paper we present a method for explicitly identifying relevant features of the observation history. These temporally extended features can be discovered using our Pulse algorithm and used to learn a compact model of the environment. Temporally extended features reveal the temporal structure of the environment while empirically outperforming other history-based approaches.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 192, 5 June 2016, Pages 49–60

نویسندگان

Robert Lieck, Marc Toussaint,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : به طور موقت ویژگی های تمدید در یادگیری تقویت مبتنی بر مدل با مشاهدات جزئی

دسترسی سریع

ارتباط

English Website