کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4962700 1446653 2017 17 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Emergent behaviors and scalability for multi-agent reinforcement learning-based pedestrian models
ترجمه فارسی عنوان
رفتارهای مهاجم و مقیاس پذیری برای مدل های پیاده روی مبتنی بر یادگیری تقویت چند عامل
ترجمه چکیده
این مقاله رفتارهای شدید گروههای عابر پیاده را که از طریق مدل یادگیری تقویت چندگانه توسعه یافته در گروه ما یاد می گیرد، بررسی می کند. پنج سناریو که در ادبیات مدل عابر پیاده مورد مطالعه قرار گرفتند و با سطوح مختلف پیچیدگی، به منظور تحلیل قدرت و مقیاس پذیری مدل، شبیه سازی شدند. در ابتدا، یک گروه کاهش یافته از عوامل باید با تعامل با محیط زیست در هر سناریو یاد بگیرند. در این مرحله هر عامل یک کنترل کننده سینماتیک خود را می آموزد که در یک زمان شبیه سازی رانندگی می کند. در مرحله دوم، تعدادی از عوامل شبیه سازی شده در هر سناریویی که متقاضیان قبلا آموخته اند، افزایش می یابد تا آزمایش رفتار ظاهری ماکروسکوپیک بدون یادگیری اضافی را آزمایش کنند. این استراتژی به ما امکان می دهد تا ثبات و انسجام و کیفیت رفتارهای آموخته شده را ارزیابی کنیم. برای این منظور از ابزارهای مختلفی از پویایی عابر پیاده استفاده شده است، مانند نمودارهای اساسی و نقشه های چگالی. نتایج نشان می دهد که مدل توسعه یافته قادر به شبیه سازی رفتارهای رفتاری میکرو و ماکرو انسان برای سناریوهای شبیه سازی شده مورد مطالعه قرار گرفته است، از جمله مواردی که تعداد عابران پیاده شده با یک مرتبه از لحاظ مقیاس با توجه به وضعیت آموخته شده اند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
This paper analyzes the emergent behaviors of pedestrian groups that learn through the multiagent reinforcement learning model developed in our group. Five scenarios studied in the pedestrian model literature, and with different levels of complexity, were simulated in order to analyze the robustness and the scalability of the model. Firstly, a reduced group of agents must learn by interaction with the environment in each scenario. In this phase, each agent learns its own kinematic controller, that will drive it at a simulation time. Secondly, the number of simulated agents is increased, in each scenario where agents have previously learnt, to test the appearance of emergent macroscopic behaviors without additional learning. This strategy allows us to evaluate the robustness and the consistency and quality of the learned behaviors. For this purpose several tools from pedestrian dynamics, such as fundamental diagrams and density maps, are used. The results reveal that the developed model is capable of simulating human-like micro and macro pedestrian behaviors for the simulation scenarios studied, including those where the number of pedestrians has been scaled by one order of magnitude with respect to the situation learned.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Simulation Modelling Practice and Theory - Volume 74, May 2017, Pages 117-133
نویسندگان
, , ,