کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6861707 1439257 2018 7 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Tackling the start-up of a reinforcement learning agent for the control of wastewater treatment plants
ترجمه فارسی عنوان
مقابله با راه اندازی عامل یادگیری تقویت برای کنترل گیاهان تصفیه فاضلاب
کلمات کلیدی
ترجمه چکیده
مشکلات یادگیری تقویتی شامل انجام یادگیری است. بنابراین، یک عامل یادگیری تقویت کننده باید گاهی اوقات (در حالی که انجام) برای یادگیری شکست بخورد. با این وجود، حتی با این خطای شروع، حداقل در مرحله یادگیری غیر بهینه معرفی شده است، یادگیری تقویت می تواند در برخی از حوزه ها مانند کنترل یک گیاه تصفیه فاضلاب مقرون به صرفه باشد. با این حال، در گیاهان تصفیه فاضلاب، تلاش برای حل مشکلات روزمره، اپراتورهای گیاهی معمولا در معرض خطر قرار ندارند که گیاه خود را در دست یک عامل یادگیری تقویت ناپذیر و غیرمتعارف ترک کنند. در حقیقت، تا حدودی واضح است که اپراتورهای کارخانه باید اولا بررسی کنند که عامل آموزش دیده است و این کار به همان اندازه که در کارخانه خاص آنها کار می کند، کار می کند. در این مقاله، ما با ارائه یک دستورالعمل قبلی به عامل یادگیری تقویت، راه حل این مشکل را پیش از این که اجازه دهیم آن را در کارخانه انجام دهیم، ارائه می دهیم. در واقع، این دستورالعمل قبلی، نقطه اصلی مقاله است. علاوه بر این، این دستورالعمل توسط اپراتور گیاه به زحمت داده می شود. همانطور که خواهیم دید، این راه حل تنها راه حل مشکل راه اندازی گیاه را در دست یک عامل ناتوان را حل نمی کند، بلکه عملکرد آینده عامل را نیز بهبود می بخشد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Reinforcement learning problems involve learning by doing. Therefore, a reinforcement learning agent will have to fail sometimes (while doing) in order to learn. Nevertheless, even with this starting error, introduced at least during the non-optimal learning stage, reinforcement learning can be affordable in some domains like the control of a wastewater treatment plant. However, in wastewater treatment plants, trying to solve the day-to-day problems, plant operators will usually not risk to leave their plant in the hands of an inexperienced and untrained reinforcement learning agent. In fact, it is somewhat obvious that plant operators will require firstly to check that the agent has been trained and that it works as it should at their particular plant. In this paper, we present a solution to this problem by giving a previous instruction to the reinforcement learning agent before we let it act on the plant. In fact, this previous instruction is the key point of the paper. In addition, this instruction is given effortlessly by the plant operator. As we will see, this solution does not just solve the starting up problem of leaving the plant in the hands of an untrained agent, but it also improves the future performance of the agent.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 144, 15 March 2018, Pages 9-15
نویسندگان
, , , ,