کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
10106955 | 1615014 | 2018 | 6 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Feedback delay impaired reinforcement learning: Principal components analysis of Reward Positivity
ترجمه فارسی عنوان
تأخیر در بازخورد باعث اختلال در تقویت یادگیری است؛ تجزیهوتحلیل مؤلفههای اصلی از پاداش مثبت
همین الان دانلود کنید
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
FRN، تأخیر بازخورد، پاداش مثبت، PCA، تقویت یادگیری
فهرست مطالب مقاله
چکیده
کلمات کلیدی
1-مقدمه
2. روشها
1-2 ) شرکتکنندگان
3. نتایج
1-3 ) نتایج رفتاری
کلمات کلیدی
1-مقدمه
2. روشها
1-2 ) شرکتکنندگان
3. نتایج
1-3 ) نتایج رفتاری
ترجمه چکیده
بازخورد نقش مهمی در تقویت یادگیری بازی میکند، بااینحال معمول است که تصمیمگیرنده همیشه نتواند نتیجه را بلافاصله پس از اقدامات خود به دست آورد. در عوض وقتی بازخورد چند ثانیه، چند روز یا بیشتر به تعویق میافتد مطالعات نشان دادهاند که پردازش دادههای بازخورد با زمانهای مختلف انتظار میتواند مکانیسمهای مختلف مغزی را درگیر کند. بهطور خاص، پردازش بازخورد فوری استریاتوم را بکار میگیرد [13،14]، درحالیکه پردازش بازخورد تأخیر توسط لوب تمپورال میانی (MTL)، در درجه اول هیپوکامپ پشتیبانی میشود [15]. بر این اساس، چندین مطالعه ERP نیز بر دوره زمانی پردازش بازخورد با زمان انتظار دستکاریشده و بین عمل و بازخورد تمرکز کردهاند. وینبرگ و همکاران [16] شرطبندی انتخاب اجباری را برای تجزیهوتحلیل میزان تأخیر بازخورد در FRN اتخاذ کردند. نتایج آنها نشان میدهد که دامنه FRN در تأخیرهای طولانی (6 ثانیه پس از پاسخ) در مقایسه با تأخیرهای کوتاه (1 ثانیه پس از پاسخ) کاهش مییابد. علاوه بر این، پیتربرز و همکاران. [17] یک کار یادگیری احتمالی را برای بررسی عملکرد FRN تلفیقشده با افزایش تأخیرهای بازخورد، یعنی تأخیر کوتاه (500 ms)، تأخیر متوسط (3500 ms) یا تأخیر طولانی (6500 ms) بکار برد. آنها یک رابطه خطی منفی بین دامنه امواج اختلاف بین زمان بازخورد منفی و بازخورد مثبت و تأخیر بازخورد پیدا کردند. نویسندگان اظهار داشتند که تأثیر متغیرهای مختلف RewP ممکن است تغییر تدریجی فعالیت مغزی را از استریاتوم به هیپوکامپ بازتاب دهد. علاوه بر این، آربل و همکاران. [18] اشاره کردند که FRN و N170 دو مؤلفه مهم ERP هستند که به ترتیب، میتوانند فعالیت عصبی در استریاتوم و MTL را ثبت کنند، هنگامیکه فردی از بازخورد فوری و بازخورد تأخیر یاد میگیرد. بااینحال یکی از مطالعات قبلی گروه ما نشان داده است که P300، بجای RewP، نسبت به زمان تأخیر حساس است [19]. بنابراین، این موضوع که FRN یا RewP نسبت به زمان تأخیر حساس است بحثبرانگیز است.
موضوعات مرتبط
علوم زیستی و بیوفناوری
علم عصب شناسی
علوم اعصاب (عمومی)
چکیده انگلیسی
An immediate feedback after action facilitated reinforcement learning in dynamically varying environments. With several seconds delay, a series of event-related potential (ERP) studies have recently conducted to explore how delayed feedback influences learning processes and corresponding brain activities by measuring the Reward Positivity and N170 component. However, it remains unclear how does our brain process a feedback that is delayed longer and interrupted by other trials. In the present study, participants were asked to undertake a time-estimation task in two different conditions. Feedback was presented right after their actions in the immediate feedback condition, while it was presented after another five trials in the delayed feedback condition. By recording feedback related activities, we aim to test whether, or not, delayed feedback impairs reinforcement learning, the Reward Positivity and N170 amplitude. The behavioural results show that delayed feedback can reduce behavioural adjustment efficiency from trial-to-trial. To reduce component overlapping, we adopted the temporospatial principal components analysis (PCA) to separate the Reward Positivity from other ERP components. Results indicate that the Reward Positivity is decreased in the delayed feedback condition compared to the immediate feedback condition, however, no difference of N170 amplitude is found between the two conditions. These results indicate that delayed feedback impairs reinforcement learning process in terms of behavioural adjustment and brain activities even though these feedbacks are truly associated with participants' previous actions.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neuroscience Letters - Volume 685, 15 October 2018, Pages 179-184
Journal: Neuroscience Letters - Volume 685, 15 October 2018, Pages 179-184
نویسندگان
Hang Yin, Yu Wang, Xukai Zhang, Peng Li,