کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
7303085 1475302 2016 18 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Active inference and learning
ترجمه فارسی عنوان
استنتاج فعال و یادگیری
کلمات کلیدی
ترجمه چکیده
این مقاله، یک نتیجه استنتاج فعالانه از رفتار انتخابی و یادگیری را ارائه می دهد. این تمرکز بر تمایز بین رفتار هدف و رفتار عادی و نحوه ارتباط آنها با یکدیگر است. ما نشان می دهیم که عادت ها به طور طبیعی (و به طور خودکار) از طریق بهینه سازی سیاست پیوسته هنگامی که عوامل با سیاست های عمل دولت مجهز می شوند، ظهور می کنند. در استنتاج فعال، رفتار، جنبه های اکتشافی (معرفت شناختی) و استثمعی (عملگرا) دارند که به ابهام و ریسک حساس هستند، در حالی که رفتار معرفتی (حل ابهام) رفتار رفتار عملگرایانه (به دنبال اشتباه) و ظهور عادت های بعدی است. گرچه سیاستهای هدفمند و معمول معمولا با طرحهای مبتنی بر مدل و بدون مدل سازگار هستند، اما تمایز مهم تر بین شیوه های باور نکردنی و مبتنی بر اعتقاد پیدا شده است. به روز رسانی باورهای اساسی (تئوری) یک نظریه فرایند جامع (اگر استعاری) برای چندین پدیده را شامل می شود، از جمله انتقال واکنش های دوپامین، یادگیری معکوس، شکل گیری عادت و کاهش ارزش. در نهایت، ما نشان می دهیم که استنتاج فعال در صورت عدم ابهام، به یک طرح کلاسیک (بلمن) کاهش می یابد.
موضوعات مرتبط
علوم زیستی و بیوفناوری علم عصب شناسی علوم اعصاب رفتاری
چکیده انگلیسی
This paper offers an active inference account of choice behaviour and learning. It focuses on the distinction between goal-directed and habitual behaviour and how they contextualise each other. We show that habits emerge naturally (and autodidactically) from sequential policy optimisation when agents are equipped with state-action policies. In active inference, behaviour has explorative (epistemic) and exploitative (pragmatic) aspects that are sensitive to ambiguity and risk respectively, where epistemic (ambiguity-resolving) behaviour enables pragmatic (reward-seeking) behaviour and the subsequent emergence of habits. Although goal-directed and habitual policies are usually associated with model-based and model-free schemes, we find the more important distinction is between belief-free and belief-based schemes. The underlying (variational) belief updating provides a comprehensive (if metaphorical) process theory for several phenomena, including the transfer of dopamine responses, reversal learning, habit formation and devaluation. Finally, we show that active inference reduces to a classical (Bellman) scheme, in the absence of ambiguity.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neuroscience & Biobehavioral Reviews - Volume 68, September 2016, Pages 862-879
نویسندگان
, , , , , ,