یادگیری تقویتی | دانلود مقالات ISI یادگیری تقویتی

آشنایی با موضوع

یادگیری تقویتی یکی از گرایش‌های یادگیری ماشینی است که از روانشناسی رفتارگرایی الهام می‌گیرد. این روش بر رفتارهایی تمرکز دارد که ماشین باید برای بیشینه کردن پاداشش انجام دهد. این مسئله، با توجه به گستردگی‌اش، در زمینه‌های گوناگونی بررسی می‌شود. مانند: نظریه بازی‌ها، نظریه کنترل، تحقیق در عملیات، نظریه اطلاعات، سامانه چندعامله، هوش ازدحامی، آمار، الگوریتم ژنتیک، بهینه‌سازی بر مبنای شبیه‌سازی. در مبحث تحقیق در عملیات و در ادبیات کنترل، حوزه‌ای که در آن روش یادگیری تقویتی مطالعه می‌شود برنامه‌نویسی تخمینی پویای (approximate dynamic programming) خوانده می‌شود. این مسئله در تئوری کنترل بهینه نیز مطالعه شده است. البته دغدغه اصلی بیشتر مطالعات در این زمینه، اثبات وجود پاسخ بهینه و یافتن ویژگی‌های آن است و به دنبال جزئیات یادگیری یا تخمین نیست. یادگیری تقویتی در اقتصاد و نظریه بازیها بیشتر به بررسی تعادل‌های ایجاد شده تحت عقلانیت محدود می‌پردازد. در یادگیری ماشینی با توجه به این که بسیاری از الگوریتم‌های یادگیری تقویتی از تکنیک‌های برنامه‌نویسی پویا استفاده می‌کنند معمولاً مسئله تحت عنوان یک فرایند تصمیم‌گیری مارکف مدل می‌شود. تفاوت اصلی بین روش‌های سنتی و الگوریتم‌های یادگیری تقویتی این است که در یادگیری تقویتی نیازی به داشتن اطلاعات راجع به فرایند تصمیم‌گیری ندارد و این که این روش روی فرایندهای مارکف بسیار بزرگی کار می‌کند که روش‌های سنتی در آنجا ناکارآمدند. یادگیری تقویتی با یادگیری با نظارت معمول دو تفاوت عمده دارد، نخست اینکه در آن زوج‌های صحیح ورودی و خروجی در کار نیست و رفتارهای ناکارامد نیز از بیرون اصلاح نمی‌شوند، و دیگر آنکه تمرکز زیادی روی کارایی زنده وجود دارد که نیازمند پیدا کردن یک تعادل مناسب بین اکتشاف چیزهای جدید و بهره‌برداری از دانش اندوخته شده دارد. این سبک-سنگین کردن بین بهره‌برداری و اکتشاف در یادگیری تقویتی برای فرایندهای مارکف متناهی، تقریباً به طور کامل در مسئلهٔ راهزن چند دست (Multi-armed bandit) بررسی شده. اجزای یادگیری تقویتی ۱- policy شیوه رفتار agent را در زمان داده شده تعریف می کند. یعنی policy می گوید در هر حالت کدام عمل بهتر است. ۲- تابع پاداش هدف را در تابع یادگیرنده تعیین می کند. این تابع هدفش این است که به ازای هر عمل عامل یک پاداش بدهد پس به هدف که نزدیک می شود پاداش بیشتر می شود. تابع پاداش مهم است اگر بد تعریف شود عامل دیر یاد می گیرد. Reward کوتاه مدت و value بلند مدت است یعنی ممکن است یک خانه پاداش نداشته باشد ولی ما را به هدف نزدیک تر کند پس value بالاتری دارد. ۳- value function نگاه بلند مدت دارد. برای هر حالت یک مقدار تعیین می کند که هر چه بیشتر باشد یعنی به هدف نزدیک تر شده ایم. مانند اینکه در یک بازی اجازه دهید حریف مهره شما را بزند در این حالت پاداش نمی گیرید ولی به حالت دیگری می روید که بهتر است این یعنی نگاه بلند مدت. ۴- مدل اختیاری است. در ابتدا نمی دانیم احتمال اینکه از حالتی به حالت دیگر برویم چقدر است. مسئله یادگیری تقویتی احتمالاتی و stocastic است و State ها یا حالات آن nondeterministic می باشد. یعنی به ازای یک عمل می تواند به همه حالات برود ولی با یک احتمال. هر عمل یا action یک احتمال است و رفتن از یک حالت به حالت دیگر هم احتمال است. هدف یادگیرنده ماکزیمم کردن پاداش بلند مدت می باشد. در یک مسئله یادگیری تقویتی با عاملی روبرو هستیم که از طریق سعی و خطا با محیط تعامل کرده و یاد میگیرد تا عملی بهینه را برای رسیدن به هدف انتخاب نماید. یادگیری تقویتی از اینرو مورد توجه است که راهی برای آموزش عاملها برای انجام یک عمل از طریق پاداش و تنبیه است بدون اینکه لازم باشد نحوه انجام عمل را برای عامل مشخص نماید.

در این صفحه تعداد 1003 مقاله تخصصی درباره یادگیری تقویتی که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید.
در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.

مقالات ISI یادگیری تقویتی (ترجمه نشده)

مقالات زیر هنوز به فارسی ترجمه نشده اند.
در صورتی که به ترجمه آماده هر یک از مقالات زیر نیاز داشته باشید، می توانید سفارش دهید تا مترجمان با تجربه این مجموعه در اسرع وقت آن را برای شما ترجمه نمایند.

تقویت کنترل مبتنی بر یادگیری مبتنی بر محاسبات و شناسایی سیستم برای سیستم های خطی

Reinforcement learning based computational adaptive optimal control and system identification for linear systems

Keywords: یادگیری تقویتی; Adaptive control; Optimal control; Reinforcement learning; System identification; Uncertain systems;

دانلود رایگان متن کامل مقاله ISI 13 صفحه سال انتشار : 2016 سفارش ترجمه

یک عامل مصنوعی خودآموز برای شخصی سازی مدل کامپیوتری چند فیزیک

A self-taught artificial agent for multi-physics computational model personalization

Keywords: یادگیری تقویتی; Computational modeling; Model personalization; Reinforcement learning; Artificial intelligence;

دانلود رایگان متن کامل مقاله ISI 13 صفحه سال انتشار : 2016 سفارش ترجمه

ارتباط شناختی و حالت استراحتی در عملکرد اسکیزوفرنیا

Cognition and resting-state functional connectivity in schizophrenia

Keywords: یادگیری تقویتی; Schizophrenia; Cognition; IQ; Executive functioning; Generalized cognitive deficit; Resting-state fMRI; Functional connectivity; Functional brain networks; Go/NoGo; Reinforcement learning; Default mode network; Task-positive networks; Cognitive dysmetria

دانلود رایگان متن کامل مقاله ISI 13 صفحه سال انتشار : 2016 سفارش ترجمه

گزارش آرشیو آموزش تقویت نیرومندی در بیماران مبتلا به اسکیزوفرنی: ارتباط با انهدونی و تخریب

Archival ReportProbabilistic Reinforcement Learning in Patients With Schizophrenia: Relationships to Anhedonia and Avolition

Keywords: یادگیری تقویتی; Anhedonia; Motivation; Prediction error; Reinforcement learning; Schizophrenia; Striatum;

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2016 سفارش ترجمه

یادگیری خط مشی گفتگو متقاعد کننده همکاری با استفاده از فریم

Learning cooperative persuasive dialogue policies using framing

Keywords: یادگیری تقویتی; Cooperative persuasive dialogue; Framing; Reinforcement learning; Dialogue modeling; Dialogue system;

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2016 سفارش ترجمه

شامل توصیف های متضاد به تصمیم گیری از تجربه

Incorporating conflicting descriptions into decisions from experience

Keywords: یادگیری تقویتی; Decision-making; Decisions from experience; Reinforcement learning; Repeated decisions; Warning labels;

دانلود رایگان متن کامل مقاله ISI 15 صفحه سال انتشار : 2016 سفارش ترجمه

امضاهای عصبی از پیشرفت های مبتنی بر تجربه در تصمیم گیری قطعی

Neural signatures of experience-based improvements in deterministic decision-making

Keywords: یادگیری تقویتی; Memory; Feedback; Reinforcement learning; Drift-diffusion model; Basal ganglia; Control

دانلود رایگان متن کامل مقاله ISI 15 صفحه سال انتشار : 2016 سفارش ترجمه

یک مدل مبتنی بر شایستگی برای توسعه یک زبان نحوی برای عوامل مصنوعی

A competence-performance based model to develop a syntactic language for artificial agents

Keywords: یادگیری تقویتی; Stochastic grammars; Grammatical evolution; Reinforcement learning; Language games; Multi-agents systems;

دانلود رایگان متن کامل مقاله ISI 16 صفحه سال انتشار : 2016 سفارش ترجمه

یک چارچوب طراحی برای مجموعه سلسله مراتبی از استخراج ویژگی های متعدد و طبقه بندی های چندگانه

A design framework for hierarchical ensemble of multiple feature extractors and multiple classifiers

Keywords: یادگیری تقویتی; Ensemble of detection systems; Multiple feature extractors; Multiple classifiers; Pedestrian detection; Reinforcement learning; Bayesian network

دانلود رایگان متن کامل مقاله ISI 16 صفحه سال انتشار : 2016 سفارش ترجمه

طراحی یک خط سرعت بالا به دنبال ربات که به آرامی به دنبال منحنی تنگ است

Design of a high-speed line following robot that smoothly follows tight curves

Keywords: یادگیری تقویتی; Artificial neural networks; Reinforcement learning; Learning Vector Quantization; Low-cost line following robot; Non-linear control;

دانلود رایگان متن کامل مقاله ISI 16 صفحه سال انتشار : 2016 سفارش ترجمه

پلاستیکی رفتاری از طریق مدولاسیون نورون های سوئیچ

Behavioral plasticity through the modulation of switch neurons

Keywords: یادگیری تقویتی; Switch neuron; Behavioral plasticity; Neuromodulation; Gating; Adaptive behavior; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 17 صفحه سال انتشار : 2016 سفارش ترجمه

ترکیب سرویس موثر با استفاده از چندین عامل تقویت یادگیری

Effective service composition using multi-agent reinforcement learning

Keywords: یادگیری تقویتی; Web service composition; Multi-agent; Reinforcement learning; Q-learning

دانلود رایگان متن کامل مقاله ISI 18 صفحه سال انتشار : 2016 سفارش ترجمه

روش یادگیری تقویتی برای تعویض قطار در یک خط راه آهن تک

Reinforcement learning approach for train rescheduling on a single-track railway

Keywords: یادگیری تقویتی; Train rescheduling; Artificial intelligence; Reinforcement learning; Q-learning

دانلود رایگان متن کامل مقاله ISI 18 صفحه سال انتشار : 2016 سفارش ترجمه

یادگیری تقویتی در یک مدل بیوسیانتیستی مبتنی بر مدار عصبی تالامو کورتکس است

Reinforcement learning in a bio-connectionist model based in the thalamo-cortical neural circuit

Keywords: یادگیری تقویتی; Reinforcement learning; Sparse coding; Thalamo-cortical; Cognition; Connectionism; Fuzzy neural network;

دانلود رایگان متن کامل مقاله ISI 19 صفحه سال انتشار : 2016 سفارش ترجمه

تجمع حالت افراطی فراتر از تصمیم گیری مارکوف

Extreme state aggregation beyond Markov decision processes

Keywords: یادگیری تقویتی; State aggregation; Reinforcement learning; Non-MDP;

دانلود رایگان متن کامل مقاله ISI 19 صفحه سال انتشار : 2016 سفارش ترجمه

کنترل تطبیقی قوی مبتنی بر داده ها برای یک کلاس از سیستم های نامحدود غیر ورودی محدود با استفاده از یادگیری تقویت انتگرال

Data-based robust adaptive control for a class of unknown nonlinear constrained-input systems via integral reinforcement learning

Keywords: یادگیری تقویتی; Adaptive dynamic programming; Input constraint; Neural networks; Optimal control; Reinforcement learning; Robust control;

دانلود رایگان متن کامل مقاله ISI 21 صفحه سال انتشار : 2016 سفارش ترجمه

چگونه مدل های سلسله مراتبی، برآوردهای نقطه ای از پارامترهای مدل در سطح فردی را بهبود می بخشد

How hierarchical models improve point estimates of model parameters at the individual level

Keywords: یادگیری تقویتی; HB; hierarchical Bayes; EB; empirical Bayes; MLE; maximum likelihood estimation; SEIP; standard error (of single-subject MLE) of the individual parameter; LL; log-likelihood; SDT; signal detection theory; RL; reinforcement learning; s.d.; standard deviati

دانلود رایگان متن کامل مقاله ISI 22 صفحه سال انتشار : 2016 سفارش ترجمه

یکی از جدیدترین ابزارهای تقویت کننده ذرات در معرض یادگیری است

A new Reinforcement Learning-based Memetic Particle Swarm Optimizer

Keywords: یادگیری تقویتی; Memetic algorithm; Particle Swarm Optimization; Reinforcement learning; Local search;

دانلود رایگان متن کامل مقاله ISI 22 صفحه سال انتشار : 2016 سفارش ترجمه

برنامه ریزی آنلاین وسایل نقلیه پلاگین در طرح های قیمت گذاری پویا

Online scheduling of plug-in vehicles in dynamic pricing schemes

Keywords: یادگیری تقویتی; Demand response; Learning automata; Online algorithm; Plug-in electric vehicle; Real time pricing; Reinforcement learning;

دانلود رایگان متن کامل مقاله ISI 24 صفحه سال انتشار : 2016 سفارش ترجمه

یک روش یادگیری تقویت کننده چندگانه برای ترکیب سرویس پویا

A multi-agent reinforcement learning approach to dynamic service composition

Keywords: یادگیری تقویتی; Web service composition; Reinforcement learning; Multi-agent

دانلود رایگان متن کامل مقاله ISI 24 صفحه سال انتشار : 2016 سفارش ترجمه

شخصی سازی خودکار محتوای وب از طریق تقویت یادگیری

Automatic web content personalization through reinforcement learning

Keywords: یادگیری تقویتی; Web personalization; User profiling; Reinforcement learning;

دانلود رایگان متن کامل مقاله ISI 28 صفحه سال انتشار : 2016 سفارش ترجمه

یک ترکیب برنامه ریزی خودکار و یادگیری تقویت برای تصمیم گیری کارآمد و قوی

A synthesis of automated planning and reinforcement learning for efficient, robust decision-making

Keywords: یادگیری تقویتی; Automated planning; Reinforcement learning; Autonomous robot; Robot learning; Answer set programming;

دانلود رایگان متن کامل مقاله ISI 28 صفحه سال انتشار : 2016 سفارش ترجمه

نوسانات تتا از مناطق فرعی کارکردی قشر پیشانی جلوگیری می کند

Theta oscillations integrate functionally segregated sub-regions of the medial prefrontal cortex

Keywords: یادگیری تقویتی; Reward processing; Theta oscillations; Medial prefrontal cortex; Reinforcement learning;

دانلود رایگان متن کامل مقاله ISI 36 صفحه سال انتشار : 2016 سفارش ترجمه

اتصالات آناتومیک پیشین وابسته پیش بینی تفاوت های مربوط به سن و دشواری را در یادگیری تقویت می کند

Frontostriatal anatomical connections predict age- and difficulty-related differences in reinforcement learning

Keywords: یادگیری تقویتی; Reinforcement learning; Aging; Prefrontal cortex; Striatum; Diffusion tensor imaging; Probabilistic tractography;

دانلود رایگان متن کامل مقاله ISI 36 صفحه سال انتشار : 2016 سفارش ترجمه

نیمکره چپ می آموزد که چه چیزی درست است: یادگیری پاداش نزدیک به فرآیندهای آموزش تقویت کننده در نیمکره متعارف بستگی دارد

The left hemisphere learns what is right: Hemispatial reward learning depends on reinforcement learning processes in the contralateral hemisphere

Keywords: یادگیری تقویتی; Orienting; Reward; Reinforcement learning; Prediction error; Hemisphere; Dopamine;

دانلود رایگان متن کامل مقاله ISI 38 صفحه سال انتشار : 2016 سفارش ترجمه

احتمال تعقیب - علائم خطای پیش بینی منفی و مثبت در دامنه ها

Chasing probabilities - Signaling negative and positive prediction errors across domains

Keywords: یادگیری تقویتی; Probabilistic reversal learning; Valence; Domain; Reinforcement learning;

دانلود رایگان متن کامل مقاله ISI 51 صفحه سال انتشار : 2016 سفارش ترجمه

حساسیت نوسانات بتای پیشانی به منظور جلب اعتماد، اما نه احتمال

Sensitivity of frontal beta oscillations to reward valence but not probability

Keywords: یادگیری تقویتی; Beta oscillations; Reward prediction error; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 5 صفحه سال انتشار : 2015 سفارش ترجمه

حساسیت کاهش یافته به بازخورد خنثی و بازخورد منفی در افراد مبتلا به افسردگی خفیف: شواهد از مطالعه پتانسیل مربوط به رویداد

Reduced sensitivity to neutral feedback versus negative feedback in subjects with mild depression: Evidence from event-related potentials study

Keywords: یادگیری تقویتی; Neutral feedback; Depression; FRN; ACC; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 6 صفحه سال انتشار : 2015 سفارش ترجمه

میزان چشم خود به خودی پیش بینی می کند که یادگیری از نتایج منفی، اما نه مثبت

Spontaneous eye blink rate predicts learning from negative, but not positive, outcomes

Keywords: یادگیری تقویتی; Eye blink rate; Dopamine; Reinforcement learning; Basal ganglia; Negative feedback;

دانلود رایگان متن کامل مقاله ISI 7 صفحه سال انتشار : 2015 سفارش ترجمه

سن از کاهش تاخیر حاد دوپامین در یادگیری اجتناب غیرفعال می کند

Age moderates the effect of acute dopamine depletion on passive avoidance learning

Keywords: یادگیری تقویتی; Emerging adults; Mood; Punishment; Reinforcement learning; Reward;

دانلود رایگان متن کامل مقاله ISI 7 صفحه سال انتشار : 2015 سفارش ترجمه

سازگاری در بازی های زبان نحوی مبتنی بر بینش برای تیم های روبات ها با استفاده از گرامرهای معمول تصادفی و یادگیری تقویت: موارد کاملا مستقل و مورد سوژه انسانی

Alignment in vision-based syntactic language games for teams of robots using stochastic regular grammars and reinforcement learning: The fully autonomous case and the human supervised case

Keywords: یادگیری تقویتی; Stochastic grammars; Reinforcement learning; Dynamics of artificial languages; Language games; Multi-robot systems; Human–robots interaction

دانلود رایگان متن کامل مقاله ISI 7 صفحه سال انتشار : 2015 سفارش ترجمه

مدل انتشار نفوذ در یادگیری پاداش و مجازات در اسکیزوفرنی: مدلسازی و داده های تجربی

Drift diffusion model of reward and punishment learning in schizophrenia: Modeling and experimental data

Keywords: یادگیری تقویتی; Schizophrenia; Reinforcement learning; Decision making; Reward; Punishment; Drift diffusion model (DDM)

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2015 سفارش ترجمه

اولویت بازگشت فوری از یک قانون یادگیری سیناپسی برای به حداکثر رساندن بازگشت ظاهر شد

Immediate return preference emerged from a synaptic learning rule for return maximization

Keywords: یادگیری تقویتی; Inter-temporal choice; Delay discount; Reinforcement learning; Synaptic plasticity

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2015 سفارش ترجمه

تقویت کنترل یادگیری برای دستکاری هماهنگ چند ربات

Reinforcement learning control for coordinated manipulation of multi-robots

Keywords: یادگیری تقویتی; Multi-robots coordination; Reinforcement learning; Robot control

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2015 سفارش ترجمه

کنترل بهینه آنلاین از سیستم های غیر خطی زمان گسسته ناشناخته با استفاده از برنامه ریزی پویای سازگار مبتنی بر زمان

Online optimal control of unknown discrete-time nonlinear systems by using time-based adaptive dynamic programming

Keywords: یادگیری تقویتی; Adaptive dynamic programming; Online optimal control; Reinforcement learning; Discrete-time systems;

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2015 سفارش ترجمه

کنترل کورتیکواستریاتتا از اقدام هدفمند در اسکیزوفرنیا دچار اختلال می شود

Corticostriatal Control of Goal-Directed Action Is Impaired in Schizophrenia

Keywords: یادگیری تقویتی; Choice; Decision-making; Executive dysfunction; Predictive learning; Reinforcement learning; Reward;

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2015 سفارش ترجمه

دستکاری متلاشی شده

Dissipatively actuated manipulation

Keywords: یادگیری تقویتی; Robotic manipulation; Dissipative actuation; Non-linear control; Receding horizon control; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2015 سفارش ترجمه

شواهد مغزی و رفتاری برای مکانیسم یادگیری اجتماعی در زنان مبتلا به اختلال استرس پس از قاعدگی مرتبط است

Brain and behavioral evidence for altered social learning mechanisms among women with assault-related posttraumatic stress disorder

Keywords: یادگیری تقویتی; PTSD; Assault; fMRI; Reinforcement learning; Trust; Social deficits;

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2015 سفارش ترجمه

کنترل بهینه سیستم های متغیر گسسته غیرخطی با استفاده از ساختار تقریبی شبکه جدید عصبی

Optimal control of nonlinear discrete time-varying systems using a new neural network approximation structure

Keywords: یادگیری تقویتی; Multiple-model; Optimal control; Adaptive self- organizing map; Reinforcement learning; Value function approximation

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2015 سفارش ترجمه

یادگیری حرکات نقطه به نقطه در یک اندام کششی با استفاده از پویایی های حرکت پویا

Learning point-to-point movements on an elastic limb using dynamic movement primitives

Keywords: یادگیری تقویتی; Passive compliance; Compliant robotics; Movement primitives; Reinforcement learning; Robot arm; Directed limb movement;

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2015 سفارش ترجمه

استفاده از یادگیری تقویت به کنترل دسترسی رسانه ای برای شبکه های حسگر بی سیم

Application of reinforcement learning to medium access control for wireless sensor networks

Keywords: یادگیری تقویتی; Reinforcement learning; Wireless sensor networks; Medium access control

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2015 سفارش ترجمه

سیستم های حافظه چندگانه به عنوان زیرمجموعه ای برای سیستم های مختلف تصمیم گیری

Multiple memory systems as substrates for multiple decision systems

Keywords: یادگیری تقویتی; Reinforcement learning; Relational memory;

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2015 سفارش ترجمه

انتخاب توصیفگر ویژگی سازگاری بر اساس یک استراتژی یادگیری تقویت چند جدول

Adaptive feature descriptor selection based on a multi-table reinforcement learning strategy

Keywords: یادگیری تقویتی; Reinforcement learning; Q-learning; Bag of features; Descriptors

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2015 سفارش ترجمه

علوم اعصاب الهام بخش مکانیزم انتخاب یادگیری دروغ است

A neuroscience inspired gated learning action selection mechanism

Keywords: یادگیری تقویتی; Action selection; Neural networks; Machine learning; Reinforcement learning; Genetic algorithm;

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2015 سفارش ترجمه

انتظارات مدولا بیانات عصبی والنتازی در مغز انسان است

Expectation modulates neural representations of valence throughout the human brain

Keywords: یادگیری تقویتی; Intracranial electroencephalography; ECoG; iEEG; High frequency activity; HFA; Reward; Value; Valence; Reinforcement learning;

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2015 سفارش ترجمه

مدل سازی احتمالات مداوم ساخت برنامه های شبکه ژنتیک با استفاده از یادگیری تقویتی

Continuous probabilistic model building genetic network programming using reinforcement learning

Keywords: یادگیری تقویتی; Estimation of distribution algorithm; Probabilistic model building genetic network programming; Continuous optimization; Reinforcement learning;

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2015 سفارش ترجمه

مدیریت قدرت سلسله مراتبی یک سیستم با اجزای سازنده با قدرت مستقل با استفاده از یادگیری تقویتی

Hierarchical power management of a system with autonomously power-managed components using reinforcement learning

Keywords: یادگیری تقویتی; Power management; Reinforcement learning; Temporal difference learning; Semi-Markov decision process

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2015 سفارش ترجمه

کنترل حلقه بسته بیهوشی و فشار متوسط فشار شریان با استفاده از تقویت یادگیری

Closed-loop control of anesthesia and mean arterial pressure using reinforcement learning

Keywords: یادگیری تقویتی; Active drug dosing; Anesthesia control; Hemodynamic regulation; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2015 سفارش ترجمه

رابطه بین پارامترهای یادگیری تقویت و تأثیر تاریخ تقویت در رفتار انتخابی

The relation between reinforcement learning parameters and the influence of reinforcement history on choice behavior

Keywords: یادگیری تقویتی; Reinforcement learning; History dependence; Regression model; Model-based analysis;