کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | ترجمه فارسی | نسخه تمام متن |
---|---|---|---|---|---|
7303085 | 1475302 | 2016 | 18 صفحه PDF | سفارش دهید | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Active inference and learning
ترجمه فارسی عنوان
استنتاج فعال و یادگیری
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
سفارش ترجمه تخصصی
با تضمین قیمت و کیفیت
کلمات کلیدی
استنتاج فعال، یادگیری عادت، استنتاج بیزی، هدف هدایت شده، انرژی آزاد، به دست آوردن اطلاعات، تعجب بیسین، ارزش معرفتی، اکتشاف، بهره برداری،
ترجمه چکیده
این مقاله، یک نتیجه استنتاج فعالانه از رفتار انتخابی و یادگیری را ارائه می دهد. این تمرکز بر تمایز بین رفتار هدف و رفتار عادی و نحوه ارتباط آنها با یکدیگر است. ما نشان می دهیم که عادت ها به طور طبیعی (و به طور خودکار) از طریق بهینه سازی سیاست پیوسته هنگامی که عوامل با سیاست های عمل دولت مجهز می شوند، ظهور می کنند. در استنتاج فعال، رفتار، جنبه های اکتشافی (معرفت شناختی) و استثمعی (عملگرا) دارند که به ابهام و ریسک حساس هستند، در حالی که رفتار معرفتی (حل ابهام) رفتار رفتار عملگرایانه (به دنبال اشتباه) و ظهور عادت های بعدی است. گرچه سیاستهای هدفمند و معمول معمولا با طرحهای مبتنی بر مدل و بدون مدل سازگار هستند، اما تمایز مهم تر بین شیوه های باور نکردنی و مبتنی بر اعتقاد پیدا شده است. به روز رسانی باورهای اساسی (تئوری) یک نظریه فرایند جامع (اگر استعاری) برای چندین پدیده را شامل می شود، از جمله انتقال واکنش های دوپامین، یادگیری معکوس، شکل گیری عادت و کاهش ارزش. در نهایت، ما نشان می دهیم که استنتاج فعال در صورت عدم ابهام، به یک طرح کلاسیک (بلمن) کاهش می یابد.
اگر به ترجمه دقیق تر نیاز دارید، مترجمان ما آمادگی دارند این مقاله را با کیفیت مطلوب و هزینه مناسب برای شما ترجمه نمایند.
موضوعات مرتبط
علوم زیستی و بیوفناوری
علم عصب شناسی
علوم اعصاب رفتاری
چکیده انگلیسی
This paper offers an active inference account of choice behaviour and learning. It focuses on the distinction between goal-directed and habitual behaviour and how they contextualise each other. We show that habits emerge naturally (and autodidactically) from sequential policy optimisation when agents are equipped with state-action policies. In active inference, behaviour has explorative (epistemic) and exploitative (pragmatic) aspects that are sensitive to ambiguity and risk respectively, where epistemic (ambiguity-resolving) behaviour enables pragmatic (reward-seeking) behaviour and the subsequent emergence of habits. Although goal-directed and habitual policies are usually associated with model-based and model-free schemes, we find the more important distinction is between belief-free and belief-based schemes. The underlying (variational) belief updating provides a comprehensive (if metaphorical) process theory for several phenomena, including the transfer of dopamine responses, reversal learning, habit formation and devaluation. Finally, we show that active inference reduces to a classical (Bellman) scheme, in the absence of ambiguity.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neuroscience & Biobehavioral Reviews - Volume 68, September 2016, Pages 862-879
Journal: Neuroscience & Biobehavioral Reviews - Volume 68, September 2016, Pages 862-879
نویسندگان
Karl Friston, Thomas FitzGerald, Francesco Rigoli, Philipp Schwartenbeck, John Oâ¿¿Doherty, Giovanni Pezzulo,
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
سفارش ترجمه تخصصی
با تضمین قیمت و کیفیت