دانلود رایگان مقاله: استنتاج فعال و یادگیری

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
7303085	1475302	2016	18 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Active inference and learning

ترجمه فارسی عنوان

استنتاج فعال و یادگیری

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

استنتاج فعال، یادگیری عادت، استنتاج بیزی، هدف هدایت شده، انرژی آزاد، به دست آوردن اطلاعات، تعجب بیسین، ارزش معرفتی، اکتشاف، بهره برداری،

Bayesian surprise Active inference - استنتاج فعال free energy - انرژی آزاد information gain - به دست آوردن اطلاعات Exploitation - بهره برداری Bayesian inference - تخمین بیزین یا استنباط بیزی exploration - جهانگردی یا اکتشاف goal-directed - هدف هدایت شده Habit learning - یادگیری عادت

ترجمه چکیده

این مقاله، یک نتیجه استنتاج فعالانه از رفتار انتخابی و یادگیری را ارائه می دهد. این تمرکز بر تمایز بین رفتار هدف و رفتار عادی و نحوه ارتباط آنها با یکدیگر است. ما نشان می دهیم که عادت ها به طور طبیعی (و به طور خودکار) از طریق بهینه سازی سیاست پیوسته هنگامی که عوامل با سیاست های عمل دولت مجهز می شوند، ظهور می کنند. در استنتاج فعال، رفتار، جنبه های اکتشافی (معرفت شناختی) و استثمعی (عملگرا) دارند که به ابهام و ریسک حساس هستند، در حالی که رفتار معرفتی (حل ابهام) رفتار رفتار عملگرایانه (به دنبال اشتباه) و ظهور عادت های بعدی است. گرچه سیاستهای هدفمند و معمول معمولا با طرحهای مبتنی بر مدل و بدون مدل سازگار هستند، اما تمایز مهم تر بین شیوه های باور نکردنی و مبتنی بر اعتقاد پیدا شده است. به روز رسانی باورهای اساسی (تئوری) یک نظریه فرایند جامع (اگر استعاری) برای چندین پدیده را شامل می شود، از جمله انتقال واکنش های دوپامین، یادگیری معکوس، شکل گیری عادت و کاهش ارزش. در نهایت، ما نشان می دهیم که استنتاج فعال در صورت عدم ابهام، به یک طرح کلاسیک (بلمن) کاهش می یابد.

موضوعات مرتبط

علوم زیستی و بیوفناوری علم عصب شناسی علوم اعصاب رفتاری

پیش نمایش مقاله

چکیده انگلیسی

This paper offers an active inference account of choice behaviour and learning. It focuses on the distinction between goal-directed and habitual behaviour and how they contextualise each other. We show that habits emerge naturally (and autodidactically) from sequential policy optimisation when agents are equipped with state-action policies. In active inference, behaviour has explorative (epistemic) and exploitative (pragmatic) aspects that are sensitive to ambiguity and risk respectively, where epistemic (ambiguity-resolving) behaviour enables pragmatic (reward-seeking) behaviour and the subsequent emergence of habits. Although goal-directed and habitual policies are usually associated with model-based and model-free schemes, we find the more important distinction is between belief-free and belief-based schemes. The underlying (variational) belief updating provides a comprehensive (if metaphorical) process theory for several phenomena, including the transfer of dopamine responses, reversal learning, habit formation and devaluation. Finally, we show that active inference reduces to a classical (Bellman) scheme, in the absence of ambiguity.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neuroscience & Biobehavioral Reviews - Volume 68, September 2016, Pages 862-879

نویسندگان

Karl Friston, Thomas FitzGerald, Francesco Rigoli, Philipp Schwartenbeck, John Oâ¿¿Doherty, Giovanni Pezzulo,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : استنتاج فعال و یادگیری

دسترسی سریع

ارتباط

English Website