کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6853090 658311 2016 88 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Algorithms for computing strategies in two-player simultaneous move games
ترجمه فارسی عنوان
الگوریتم برای محاسبه استراتژی در بازی دو نفره به طور همزمان
کلمات کلیدی
بازی های همزمان همزمان، بازی مارکوف، القاء عقب، جستجو درخت مونت کارلو، هرس آلفا بتا، الگوریتم دو اوراکل، پشیمانی ترسناک، به حداقل رساندن عصبانیت، بازی، تعادل نش،
ترجمه چکیده
بازی های همزمان بازی مدل های گسسته و متقابل چند مرحله ای را در جایی که در هر مرحله بازیکنان به طور همزمان اقدامات خود را انتخاب می کنند. در هر مرحله، یک بازیکن نمی داند چه اقدام دیگری را انجام می دهد، اما در غیر این صورت وضعیت کامل بازی را می داند. این فرمالیسم برای بیان بازی ها در بازی به طور کلی مورد استفاده قرار می گیرد و همچنین می تواند تقریبی گسسته ای از سناریوهای دنیای واقعی را مدل کند. در این مقاله، ما هر دو الگوریتم های جدید و جدیدی را که راهبردهای کلاس های دو بعدی بازی های متحرک صفر را محاسبه می کنند، توصیف می کنیم. الگوریتم ها شامل روش های دقیق برگشت عقب با هرس کارآمد و الگوریتم های نمونه گیری مونت کارلو می باشند. ما الگوریتم ها را در دو حالت مختلف بررسی می کنیم: حالت آفلاین، که در آن منابع محاسباتی فراوان هستند و تقریبا نزدیکی از استراتژی مطلوب، یک اولویت است و مورد جستجو آنلاین، که در آن منابع محاسباتی محدود است و به سرعت اقدام می کند، ضروری است. ما یک ارزیابی کاملی از تجربیات شش بازی اساسا برای هر دو تنظیم انجام می دهیم. برای الگوریتم های دقیق، نتایج نشان می دهد که تکنیک های هرس کردن ما برای القاء عقب مانده به طور چشمگیری زمان محاسباتی مورد نیاز الگوریتم های دقیق قبلی را بهبود می بخشد. برای الگوریتم های نمونه گیری، نتایج ارائه بینش منحصر به فرد در عملکرد خود و شناسایی تنظیمات و دامنه های مناسب برای الگوریتم های مختلف نمونه گیری.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Simultaneous move games model discrete, multistage interactions where at each stage players simultaneously choose their actions. At each stage, a player does not know what action the other player will take, but otherwise knows the full state of the game. This formalism has been used to express games in general game playing and can also model many discrete approximations of real-world scenarios. In this paper, we describe both novel and existing algorithms that compute strategies for the class of two-player zero-sum simultaneous move games. The algorithms include exact backward induction methods with efficient pruning, as well as Monte Carlo sampling algorithms. We evaluate the algorithms in two different settings: the offline case, where computational resources are abundant and closely approximating the optimal strategy is a priority, and the online search case, where computational resources are limited and acting quickly is necessary. We perform a thorough experimental evaluation on six substantially different games for both settings. For the exact algorithms, the results show that our pruning techniques for backward induction dramatically improve the computation time required by the previous exact algorithms. For the sampling algorithms, the results provide unique insights into their performance and identify favorable settings and domains for different sampling algorithms.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Artificial Intelligence - Volume 237, August 2016, Pages 1-40
نویسندگان
, , , , ,