کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10106955 1615014 2018 6 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Feedback delay impaired reinforcement learning: Principal components analysis of Reward Positivity
ترجمه فارسی عنوان
تأخیر در بازخورد باعث اختلال در تقویت یادگیری است؛ تجزیه‌وتحلیل مؤلفه‌های اصلی از پاداش مثبت
کلمات کلیدی
فهرست مطالب مقاله
چکیده

کلمات کلیدی

1-مقدمه

2. روش‌ها

1-2 ) شرکت‌کنندگان

3. نتایج

1-3 ) نتایج رفتاری

 
ترجمه چکیده
بازخورد نقش مهمی در تقویت یادگیری بازی می‌کند، بااین‌حال معمول است که تصمیم‌گیرنده همیشه نتواند نتیجه را بلافاصله پس از اقدامات خود به دست آورد. در عوض وقتی بازخورد چند ثانیه، چند روز یا بیشتر به تعویق می‌افتد مطالعات نشان داده‌اند که پردازش داده‌های بازخورد با زمان‌های مختلف انتظار می‌تواند مکانیسم‌های مختلف مغزی را درگیر کند. به‌طور خاص، پردازش بازخورد فوری استریاتوم را بکار می‌گیرد [13،14]، درحالی‌که پردازش بازخورد تأخیر توسط لوب تمپورال میانی (MTL)، در درجه اول هیپوکامپ پشتیبانی می‌شود [15]. بر این اساس، چندین مطالعه ERP نیز بر دوره زمانی پردازش بازخورد با زمان انتظار دستکاری‌شده و بین عمل و بازخورد تمرکز کرده‌اند. وینبرگ و همکاران [16] شرط‌بندی انتخاب اجباری را برای تجزیه‌وتحلیل میزان تأخیر بازخورد در FRN اتخاذ کردند. نتایج آن‌ها نشان می‌دهد که دامنه FRN در تأخیرهای طولانی (6 ثانیه پس از پاسخ) در مقایسه با تأخیرهای کوتاه (1 ثانیه پس از پاسخ) کاهش می‌یابد. علاوه بر این، پیتربرز و همکاران. [17] یک کار یادگیری احتمالی را برای بررسی عملکرد FRN تلفیق‌شده با افزایش تأخیرهای بازخورد، یعنی تأخیر کوتاه (500 ms)، تأخیر متوسط (3500 ms) یا تأخیر طولانی (6500 ms) بکار برد. آن‌ها یک رابطه خطی منفی بین دامنه امواج اختلاف بین زمان بازخورد منفی و بازخورد مثبت و تأخیر بازخورد پیدا کردند. نویسندگان اظهار داشتند که تأثیر متغیرهای مختلف RewP ممکن است تغییر تدریجی فعالیت مغزی را از استریاتوم به هیپوکامپ بازتاب دهد. علاوه بر این، آربل و همکاران. [18] اشاره کردند که FRN و N170 دو مؤلفه مهم ERP هستند که به ترتیب، می‌توانند فعالیت عصبی در استریاتوم و MTL را ثبت کنند، هنگامی‌که فردی از بازخورد فوری و بازخورد تأخیر یاد می‌گیرد. بااین‌حال یکی از مطالعات قبلی گروه ما نشان داده است که P300، بجای RewP، نسبت به زمان تأخیر حساس است [19]. بنابراین، این موضوع که FRN یا RewP نسبت به زمان تأخیر حساس است بحث‌برانگیز است.
موضوعات مرتبط
علوم زیستی و بیوفناوری علم عصب شناسی علوم اعصاب (عمومی)
چکیده انگلیسی
An immediate feedback after action facilitated reinforcement learning in dynamically varying environments. With several seconds delay, a series of event-related potential (ERP) studies have recently conducted to explore how delayed feedback influences learning processes and corresponding brain activities by measuring the Reward Positivity and N170 component. However, it remains unclear how does our brain process a feedback that is delayed longer and interrupted by other trials. In the present study, participants were asked to undertake a time-estimation task in two different conditions. Feedback was presented right after their actions in the immediate feedback condition, while it was presented after another five trials in the delayed feedback condition. By recording feedback related activities, we aim to test whether, or not, delayed feedback impairs reinforcement learning, the Reward Positivity and N170 amplitude. The behavioural results show that delayed feedback can reduce behavioural adjustment efficiency from trial-to-trial. To reduce component overlapping, we adopted the temporospatial principal components analysis (PCA) to separate the Reward Positivity from other ERP components. Results indicate that the Reward Positivity is decreased in the delayed feedback condition compared to the immediate feedback condition, however, no difference of N170 amplitude is found between the two conditions. These results indicate that delayed feedback impairs reinforcement learning process in terms of behavioural adjustment and brain activities even though these feedbacks are truly associated with participants' previous actions.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neuroscience Letters - Volume 685, 15 October 2018, Pages 179-184
نویسندگان
, , , ,