یادگیری تقویتی | دانلود مقالات ISI یادگیری تقویتی

آشنایی با موضوع

یادگیری تقویتی یکی از گرایش‌های یادگیری ماشینی است که از روانشناسی رفتارگرایی الهام می‌گیرد. این روش بر رفتارهایی تمرکز دارد که ماشین باید برای بیشینه کردن پاداشش انجام دهد. این مسئله، با توجه به گستردگی‌اش، در زمینه‌های گوناگونی بررسی می‌شود. مانند: نظریه بازی‌ها، نظریه کنترل، تحقیق در عملیات، نظریه اطلاعات، سامانه چندعامله، هوش ازدحامی، آمار، الگوریتم ژنتیک، بهینه‌سازی بر مبنای شبیه‌سازی. در مبحث تحقیق در عملیات و در ادبیات کنترل، حوزه‌ای که در آن روش یادگیری تقویتی مطالعه می‌شود برنامه‌نویسی تخمینی پویای (approximate dynamic programming) خوانده می‌شود. این مسئله در تئوری کنترل بهینه نیز مطالعه شده است. البته دغدغه اصلی بیشتر مطالعات در این زمینه، اثبات وجود پاسخ بهینه و یافتن ویژگی‌های آن است و به دنبال جزئیات یادگیری یا تخمین نیست. یادگیری تقویتی در اقتصاد و نظریه بازیها بیشتر به بررسی تعادل‌های ایجاد شده تحت عقلانیت محدود می‌پردازد. در یادگیری ماشینی با توجه به این که بسیاری از الگوریتم‌های یادگیری تقویتی از تکنیک‌های برنامه‌نویسی پویا استفاده می‌کنند معمولاً مسئله تحت عنوان یک فرایند تصمیم‌گیری مارکف مدل می‌شود. تفاوت اصلی بین روش‌های سنتی و الگوریتم‌های یادگیری تقویتی این است که در یادگیری تقویتی نیازی به داشتن اطلاعات راجع به فرایند تصمیم‌گیری ندارد و این که این روش روی فرایندهای مارکف بسیار بزرگی کار می‌کند که روش‌های سنتی در آنجا ناکارآمدند. یادگیری تقویتی با یادگیری با نظارت معمول دو تفاوت عمده دارد، نخست اینکه در آن زوج‌های صحیح ورودی و خروجی در کار نیست و رفتارهای ناکارامد نیز از بیرون اصلاح نمی‌شوند، و دیگر آنکه تمرکز زیادی روی کارایی زنده وجود دارد که نیازمند پیدا کردن یک تعادل مناسب بین اکتشاف چیزهای جدید و بهره‌برداری از دانش اندوخته شده دارد. این سبک-سنگین کردن بین بهره‌برداری و اکتشاف در یادگیری تقویتی برای فرایندهای مارکف متناهی، تقریباً به طور کامل در مسئلهٔ راهزن چند دست (Multi-armed bandit) بررسی شده. اجزای یادگیری تقویتی ۱- policy شیوه رفتار agent را در زمان داده شده تعریف می کند. یعنی policy می گوید در هر حالت کدام عمل بهتر است. ۲- تابع پاداش هدف را در تابع یادگیرنده تعیین می کند. این تابع هدفش این است که به ازای هر عمل عامل یک پاداش بدهد پس به هدف که نزدیک می شود پاداش بیشتر می شود. تابع پاداش مهم است اگر بد تعریف شود عامل دیر یاد می گیرد. Reward کوتاه مدت و value بلند مدت است یعنی ممکن است یک خانه پاداش نداشته باشد ولی ما را به هدف نزدیک تر کند پس value بالاتری دارد. ۳- value function نگاه بلند مدت دارد. برای هر حالت یک مقدار تعیین می کند که هر چه بیشتر باشد یعنی به هدف نزدیک تر شده ایم. مانند اینکه در یک بازی اجازه دهید حریف مهره شما را بزند در این حالت پاداش نمی گیرید ولی به حالت دیگری می روید که بهتر است این یعنی نگاه بلند مدت. ۴- مدل اختیاری است. در ابتدا نمی دانیم احتمال اینکه از حالتی به حالت دیگر برویم چقدر است. مسئله یادگیری تقویتی احتمالاتی و stocastic است و State ها یا حالات آن nondeterministic می باشد. یعنی به ازای یک عمل می تواند به همه حالات برود ولی با یک احتمال. هر عمل یا action یک احتمال است و رفتن از یک حالت به حالت دیگر هم احتمال است. هدف یادگیرنده ماکزیمم کردن پاداش بلند مدت می باشد. در یک مسئله یادگیری تقویتی با عاملی روبرو هستیم که از طریق سعی و خطا با محیط تعامل کرده و یاد میگیرد تا عملی بهینه را برای رسیدن به هدف انتخاب نماید. یادگیری تقویتی از اینرو مورد توجه است که راهی برای آموزش عاملها برای انجام یک عمل از طریق پاداش و تنبیه است بدون اینکه لازم باشد نحوه انجام عمل را برای عامل مشخص نماید.

در این صفحه تعداد 1003 مقاله تخصصی درباره یادگیری تقویتی که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید.
در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.

مقالات ISI یادگیری تقویتی (ترجمه نشده)

مقالات زیر هنوز به فارسی ترجمه نشده اند.
در صورتی که به ترجمه آماده هر یک از مقالات زیر نیاز داشته باشید، می توانید سفارش دهید تا مترجمان با تجربه این مجموعه در اسرع وقت آن را برای شما ترجمه نمایند.

A gradient-based reinforcement learning approach to dynamic pricing in partially-observable environments

Keywords: یادگیری تقویتی; Reinforcement learning; Dynamic pricing; Grid; Policy gradient

دانلود رایگان متن کامل مقاله ISI 7 صفحه سال انتشار : 2008 سفارش ترجمه

Euthymic Patients with Bipolar Disorder Show Decreased Reward Learning in a Probabilistic Reward Task

Keywords: یادگیری تقویتی; Anhedonia; bipolar disorder; dopamine; reinforcement learning; reward; depression

دانلود رایگان متن کامل مقاله ISI 7 صفحه سال انتشار : 2008 سفارش ترجمه

The effect of workers' visibility on effectiveness of intervention programs: Supervisory-based safety interventions

Keywords: یادگیری تقویتی; Supervisory-based safety interventions; Reinforcement learning; Visibility; Ear protection; Safe behavior

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2008 سفارش ترجمه

Reinforcement learning of recurrent neural network for temporal coding

Keywords: یادگیری تقویتی; Temporal coding; Reinforcement learning; Hodgkin–Huxley neuron; Order coding; Phase coding

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2008 سفارش ترجمه

A reinforcement agent for threshold fusion

Keywords: یادگیری تقویتی; Reinforcement learning; Image thresholding; Threshold fusion

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2008 سفارش ترجمه

Evolutionary stability affected by energy flow in the bio-network architecture

Keywords: یادگیری تقویتی; Evolutionary stability; Energy entropy; Bio-network; Nash equilibrium; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2008 سفارش ترجمه

Asynchronous cellular learning automata

Keywords: یادگیری تقویتی; Cellular automata; Learning automata; Cellular learning automata; Reinforcement learning; Cellular networks

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2008 سفارش ترجمه

Decision support system in tactical air traffic flow management for air traffic flow controllers

Keywords: یادگیری تقویتی; Air traffic flow management; Decision support system; Meta-level control; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2008 سفارش ترجمه

Dynamical model of salience gated working memory, action selection and reinforcement based on basal ganglia and dopamine feedback

Keywords: یادگیری تقویتی; Working memory; Reinforcement learning; Dopamine; Striatum; Nonlinear dynamics; Feedback; Reward; Punishment

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2008 سفارش ترجمه

Electrophysiological evidence of atypical motivation and reward processing in children with attention-deficit hyperactivity disorder

Keywords: یادگیری تقویتی; ADHD; Event-related brain potentials; Feedback error-related negativity; Reinforcement learning; Midbrain dopamine system; Reward prediction error signal

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2008 سفارش ترجمه

New algorithms of the Q-learning type

Keywords: یادگیری تقویتی; Q-learning; Reinforcement learning; Markov decision processes; Two-timescale stochastic approximation; SPSA

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2008 سفارش ترجمه

Two forms of immediate reward reinforcement learning for exploratory data analysis

Keywords: یادگیری تقویتی; Reinforcement learning; Exploratory data analysis

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2008 سفارش ترجمه

Finding intrinsic rewards by embodied evolution and constrained reinforcement learning

Keywords: یادگیری تقویتی; Intrinsic and extrinsic rewards; Reinforcement learning; Embodied evolution; Cyber Rodents

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2008 سفارش ترجمه

Case-based myopic reinforcement learning for satisfying target service level in supply chain

Keywords: یادگیری تقویتی; Reinforcement learning; Case-based reasoning; Supply chain; Inventory control; Service level

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2008 سفارش ترجمه

Individual differences in reinforcement learning: Behavioral, electrophysiological, and neuroimaging correlates

Keywords: یادگیری تقویتی; Reinforcement learning; Anterior cingulate cortex; Basal ganglia; Reward; Feedback-related negativity; Probabilistic learning;

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2008 سفارش ترجمه

Reinforcement learning and evolutionary algorithms for non-stationary multi-armed bandit problems

Keywords: یادگیری تقویتی; Decision-making agents; Action selection; Exploration–exploitation; Multi-armed bandit; Genetic algorithms; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2008 سفارش ترجمه

Reinforcing probabilistic selective Quality of Service routes in dynamic irregular networks

Keywords: یادگیری تقویتی; Quality of Service based routing; Multipath routing; Reinforcement learning; Q-routing; Dynamic irregular networks

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2008 سفارش ترجمه

Using temporal-difference learning for multi-agent bargaining

Keywords: یادگیری تقویتی; Markov decision process; Reinforcement learning; Temporal-difference learning; Risk-attitude; Online bargaining

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2008 سفارش ترجمه

A reinforcement learning model for supply chain ordering management: An application to the beer game

Keywords: یادگیری تقویتی; Supply chain; Ordering policy; Multi-agent systems; Beer game; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2008 سفارش ترجمه

Algebraic results and bottom-up algorithm for policies generalization in reinforcement learning using concept lattices

Keywords: یادگیری تقویتی; Reinforcement learning; Galois lattices

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2008 سفارش ترجمه

Reinforcement learning for problems with symmetrical restricted states

Keywords: یادگیری تقویتی; Reinforcement learning; High dimensionality; Symmetry; Elevator group control system

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2008 سفارش ترجمه

Automatic generation of fuzzy inference systems via unsupervised learning

Keywords: یادگیری تقویتی; Fuzzy inference systems; Unsupervised learning; Reinforcement learning; Fuzzy neural networks; Structure identification

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2008 سفارش ترجمه

Natural Actor-Critic

Keywords: یادگیری تقویتی; Policy-gradient methods; Compatible function approximation; Natural gradients; Actor-Critic methods; Reinforcement learning; Robot learning

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2008 سفارش ترجمه

When more is less: Feedback effects in perceptual category learning

Keywords: یادگیری تقویتی; Perceptual categorization; Cognitive neuroscience of categorization; Reinforcement learning; Dopamine; Striatum; Bayesian hypothesis testing; Feedback

دانلود رایگان متن کامل مقاله ISI 12 صفحه سال انتشار : 2008 سفارش ترجمه

A Reinforcement Learning approach to evaluating state representations in spoken dialogue systems

Keywords: یادگیری تقویتی; Spoken dialogue systems; Evaluation; Adaptive systems; Reinforcement Learning; Markov decision processes; Feature selection; Machine learning; Affect; Tutoring systems

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2008 سفارش ترجمه

Adaptive evolutionary programming based on reinforcement learning

Keywords: یادگیری تقویتی; Reinforcement learning; Evolutionary programming; Mutation; Q value

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2008 سفارش ترجمه

Automating spoken dialogue management design using machine learning: An industry perspective

Keywords: یادگیری تقویتی; Dialogue management; Machine learning; Reinforcement learning; Industry

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2008 سفارش ترجمه

Learning bidding strategies with autonomous agents in environments with unstable equilibrium

Keywords: یادگیری تقویتی; Strategic interactions; Automated agents; Reinforcement learning; Evolutionary learning; Bidding strategies; Unstable equilibrium

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2008 سفارش ترجمه

Tuning continual exploration in reinforcement learning: An optimality property of the Boltzmann strategy

Keywords: یادگیری تقویتی; Reinforcement learning; Markov decision processes; Exploration and exploitation; Maximum entropy; Shortest-path problems; Randomized strategy

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2008 سفارش ترجمه

Free gait generation with reinforcement learning for a six-legged robot

Keywords: یادگیری تقویتی; Locomotion; Walking; Six-legged robot; Reinforcement learning; Free gait

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2008 سفارش ترجمه

A dynamic routing protocol for keyword search in unstructured peer-to-peer networks

Keywords: یادگیری تقویتی; Peer-to-peer; Keyword search; Routing index; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 14 صفحه سال انتشار : 2008 سفارش ترجمه

DistanceRank: An intelligent ranking algorithm for web pages

Keywords: یادگیری تقویتی; Web ranking; Crawling; Web graph; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 16 صفحه سال انتشار : 2008 سفارش ترجمه

Reinforcement learning of motor skills with policy gradients

Keywords: یادگیری تقویتی; Reinforcement learning; Policy gradient methods; Natural gradients; Natural Actor-Critic; Motor skills; Motor primitives

دانلود رایگان متن کامل مقاله ISI 16 صفحه سال انتشار : 2008 سفارش ترجمه

Basal ganglia and dopamine contributions to probabilistic category learning

Keywords: یادگیری تقویتی; Memory; Hippocampus; Reinforcement learning; Categorization

دانلود رایگان متن کامل مقاله ISI 18 صفحه سال انتشار : 2008 سفارش ترجمه

Q-learning agents in a Cournot oligopoly model

Keywords: یادگیری تقویتی; C63; D43; D83; Collusion; Cournot oligopoly; Q-learning; Reinforcement learning;

دانلود رایگان متن کامل مقاله ISI 19 صفحه سال انتشار : 2008 سفارش ترجمه

Better or worse than expected? Aging, learning, and the ERN

Keywords: یادگیری تقویتی; Age differences; ACC; Dopamine; ERP; Error processing; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 19 صفحه سال انتشار : 2008 سفارش ترجمه

Evaluating generalizability and parameter consistency in learning models

Keywords: یادگیری تقویتی; C52; C63; D81; D83; Reinforcement learning; Cognitive models; Model selection; Decay; Interference;

دانلود رایگان متن کامل مقاله ISI 25 صفحه سال انتشار : 2008 سفارش ترجمه

A numerical analysis of the evolutionary stability of learning rules

Keywords: یادگیری تقویتی; C72; C73; C15; Monte Carlo simulation; Evolutionary stability; Learning in games; Fictitious play; Reinforcement learning; EWA learning;

دانلود رایگان متن کامل مقاله ISI 31 صفحه سال انتشار : 2008 سفارش ترجمه

SOVEREIGN: An autonomous neural system for incrementally learning planned action sequences to navigate towards a rewarded goal

Keywords: یادگیری تقویتی; Autonomous control; Pattern recognition; Categorization; Navigation; Attention; Reinforcement learning; Working memory; Planning; ART. CogEM; Gated dipole

دانلود رایگان متن کامل مقاله ISI 60 صفحه سال انتشار : 2008 سفارش ترجمه

Prediction of the optimal parameter values in reinforcement learning as a function of the environment

Keywords: یادگیری تقویتی; Reinforcement learning; Genetic algorithm with inheritance; Mobile robot; Navigation; Optimal path; Parameter prediction

دانلود رایگان متن کامل مقاله ISI 4 صفحه سال انتشار : 2007 سفارش ترجمه

Autonomous and fast robot learning through motivation

Keywords: یادگیری تقویتی; Reinforcement learning; Robot control; Autonomous agents; Genetic algorithms

دانلود رایگان متن کامل مقاله ISI 6 صفحه سال انتشار : 2007 سفارش ترجمه

Dynamic reserve site selection under contagion risk of deforestation

Keywords: یادگیری تقویتی; Reserve selection; Uncertainty; Contagion process; Stochastic dynamic programming; Reinforcement learning

دانلود رایگان متن کامل مقاله ISI 7 صفحه سال انتشار : 2007 سفارش ترجمه

A reinforcement learning approach to dynamic resource allocation

Keywords: یادگیری تقویتی; Reinforcement learning; Utility computing; Resource allocation

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2007 سفارش ترجمه

Multiple model-based reinforcement learning explains dopamine neuronal activity

Keywords: یادگیری تقویتی; Dopamine; Reinforcement learning; Multiple model; Timing prediction; Classical conditioning

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2007 سفارش ترجمه

Aggregation of web search engines based on users’ preferences in WebFusion

Keywords: یادگیری تقویتی; Meta-search engine; User preferences modeling; Click-through data; Reinforcement learning; Optimistic OWA; Decision fusion

دانلود رایگان متن کامل مقاله ISI 8 صفحه سال انتشار : 2007 سفارش ترجمه

Chaotic time series prediction for the game, Rock-Paper-Scissors

Keywords: یادگیری تقویتی; Time series prediction; Chaos theory; Game theory; Local Lyapunov Exponent; Entropy filtering; Reinforcement learning; Agent irrationality; Rock paper scissors game

دانلود رایگان متن کامل مقاله ISI 9 صفحه سال انتشار : 2007 سفارش ترجمه

A robust Markov game controller for nonlinear systems

Keywords: یادگیری تقویتی; Reinforcement learning; Markov decision process; Matrix games; Markov games; Markov game controller; Neural networks; Inverted pendulum; Two-link robot

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2007 سفارش ترجمه

Learning movement sequences with a delayed reward signal in a hierarchical model of motor function

Keywords: یادگیری تقویتی; Movement sequence; Delayed reward; Reinforcement learning; Hierarchical motor function; Continuous attractor neural network

دانلود رایگان متن کامل مقاله ISI 10 صفحه سال انتشار : 2007 سفارش ترجمه

A two-layered multi-agent reinforcement learning model and algorithm

Keywords: یادگیری تقویتی; Reinforcement learning; Multi-agent; Layered model

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2007 سفارش ترجمه

RLDDE: A novel reinforcement learning-based dimension and delay estimator for neural networks in time series prediction

Keywords: یادگیری تقویتی; Reinforcement learning-based dimension and delay estimator (RLDDE); Reinforcement learning; Neural networks; Input dimension; Time delay; Time series prediction

دانلود رایگان متن کامل مقاله ISI 11 صفحه سال انتشار : 2007 سفارش ترجمه

<< < 13 14 15 16 17 > >>

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود مقالات ISI درباره یادگیری تقویتی + ترجمه فارسی

آشنایی با موضوع

دسترسی سریع

ارتباط

English Website