دانلود رایگان مقاله: بر پایه ی توانایی یادگیری در بازی ها با مشاهدات بازپرداخت غیرمنتظره است

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
5071373	1477056	2017	38 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

On the robustness of learning in games with stochastically perturbed payoff observations

ترجمه فارسی عنوان

بر پایه ی توانایی یادگیری در بازی ها با مشاهدات بازپرداخت غیرمنتظره است

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

C61 C72 C73 Dominated strategies Nash equilibrium - تعادل نش Stochastic stability - ثبات اتفاقی Regularization - منظم سازی Robustness - نیرومندی Regret minimization - پشیمانی کم Learning - یادگیری

ترجمه چکیده

انگیزه کمبود بازخورد دقیق بازخورد در کاربرد عملی تئوری بازی، ما یک کلاس از دینامیک یادگیری را بررسی می کنیم که بازیکنان انتخاب خود را براساس مشاهدات گذشته پرداخت می کنند که در معرض سر و صدا و اختلالات تصادفی هستند. اول، در مورد تک نفره (مربوط به یک عامل برای سازگاری با یک محیط به طور دائمی در حال تغییر)، نشان می دهد که دینامیک تصادفی تحت مطالعه منجر به هیچ گونه پشیمانی تقریبا مطمئنا، صرف نظر از سطح سر و صدا در مشاهدات بازیکن. در مورد چند نفره، ما دریافتیم که استراتژی های تحت سلطه منقرض می شوند و ما نشان می دهیم که تعادل دقیق ناش به طور اتفاقی پایدار و جذاب است؛ برعکس، اگر یک دولت با ثبات یا جذب با احتمال مثبت جذب شود، این تعادل نها است. در نهایت، ما یک اصل عادی برای بازی های دو نفره ارائه می دهیم، و ما نشان می دهیم که در بازی های صفر با تعادل داخلی، میانگین زمان برای هر سطح نویز همگام با تعادل نجات می شود.

موضوعات مرتبط

علوم انسانی و اجتماعی اقتصاد، اقتصادسنجی و امور مالی اقتصاد و اقتصادسنجی

پیش نمایش مقاله

بر پایه ی توانایی یادگیری در بازی ها با مشاهدات بازپرداخت غیرمنتظره است

چکیده انگلیسی

Motivated by the scarcity of accurate payoff feedback in practical applications of game theory, we examine a class of learning dynamics where players adjust their choices based on past payoff observations that are subject to noise and random disturbances. First, in the single-player case (corresponding to an agent trying to adapt to an arbitrarily changing environment), we show that the stochastic dynamics under study lead to no regret almost surely, irrespective of the noise level in the player's observations. In the multi-player case, we find that dominated strategies become extinct and we show that strict Nash equilibria are stochastically stable and attracting; conversely, if a state is stable or attracting with positive probability, then it is a Nash equilibrium. Finally, we provide an averaging principle for 2-player games, and we show that in zero-sum games with an interior equilibrium, time averages converge to Nash equilibrium for any noise level.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Games and Economic Behavior - Volume 103, May 2017, Pages 41-66

نویسندگان

Mario Bravo, Panayotis Mertikopoulos,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : بر پایه ی توانایی یادگیری در بازی ها با مشاهدات بازپرداخت غیرمنتظره است

دسترسی سریع

ارتباط

English Website