کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6899834 1446486 2018 8 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Evaluating reinforcement learning state representations for adaptive traffic signal control
ترجمه فارسی عنوان
ارزیابی نمایندگی های دولت تقویت یادگیری برای کنترل ترافیک تطبیقی
ترجمه چکیده
یادگیری تقویت کننده بالقوه برای ایجاد کنترل کننده های مجهز به ترافیک تطبیقی ​​موثر را برای کاهش ترافیک و بهبود تحرک نشان داده است. با وجود بسیاری از مطالعات موفق تحقیقاتی، تعداد کمی از این ایده ها در عمل اجرا شده است. عدم اطمینان در مورد آنچه مورد نیاز از نظر داده ها و سنسورها برای تحقق تقویت یادگیری ترافیک کنترل سیگنال وجود دارد. ما در پی درک نیازهای داده ها و تفاوت های عملکرد در نمایندگی های مختلف دولت برای تقویت یادگیری ترافیک کنترل سیگنال است. ما سه نماینده دولت را از حالت کم به وضوح بالا مدل سازی می کنیم و عملکرد آنها را با استفاده از الگوریتم بازیگر انتقادی ناسازگار با عملکرد تقریبی شبکه عصبی در شبیه سازی مقایسه می کنیم. نتایج نشان می دهد که نمایندگی های دولتی با وضوح پایین (مانند اشغال و سرعت متوسط) تقریبا یکسان با نمایندگی های دولتی با وضوح بالا (مثلا موقعیت و سرعت خودرو فردی) انجام می شود. این نتایج نشان می دهد کنترل کننده های تقویت کننده یادگیری ترافیک ممکن است با سنسورهای معمولی مانند آشکارسازهای حلقه امکان پذیر باشند و نیازی به سنسورهای پیشرفته مانند دوربین ها یا رادار ندارند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
چکیده انگلیسی
Reinforcement learning has shown potential for developing effective adaptive traffic signal controllers to reduce traffic congestion and improve mobility. Despite many successful research studies, few of these ideas have been implemented in practice. There remains uncertainty about what the requirements are in terms of data and sensors to actualize reinforcement learning traffic signal control. We seek to understand the data requirements and the performance differences in different state representations for reinforcement learning traffic signal control. We model three state representations, from low to high-resolution, and compare their performance using the asynchronous advantage actor-critic algorithm with neural network function approximation in simulation. Results show that low-resolution state representations (e.g., occupancy and average speed) perform almost identically to high-resolution state representations (e.g., individual vehicle position and speed). These results indicate implementing reinforcement learning traffic signal controllers may be possible with conventional sensors, such as loop detectors, and do not require sophisticated sensors, such as cameras or radar.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 130, 2018, Pages 26-33
نویسندگان
, ,