کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
7562028 1491503 2018 12 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
An intelligent non-optimality self-recovery method based on reinforcement learning with small data in big data era
ترجمه فارسی عنوان
یک روش خودکشی غیر انتساب هوشمند مبتنی بر یادگیری تقویت با داده های کوچک در دوران بزرگ داده است
کلمات کلیدی
هوش خودآزاری بدون بهینه سازی، تشخیص غیر مطلوب، تقویت یادگیری، ساختار بازیگر نقش مکمل، دوران بزرگ داده،
ترجمه چکیده
فرایندهای دسته ای توجه زیادی را به عنوان یک روش تولید مهم در صنایع مدرن جذب کرده اند. اگر چه آنها به خوبی با دستگاه های کنترل مجهز هستند، فرایندهای دسته ای ممکن است به دلیل اختلالات فرآیند، پیری تجهیزات، تغییرات مواد اولیه و غیره در شرایط غیر مطلوب عمل کنند. در نتیجه، شاخص های کیفیت یا مزایای اقتصادی ممکن است با استفاده از پیش تعریف شده شرایط عملیات عادی. و این پدیده در اینجا غیر بهینه است. بنابراین، لازم است به موقع روند بهبود وضعیت بهینه خود را بدون مدل دقیق و یا مقدار داده ها را بهبود بخشد. برای حل این مشکل، این مطالعه پیشنهاد روش هوشمند خودآزمایی غیر انتسابی مبتنی بر یادگیری تقویت می کند. ابتدا متغیرهای علمی که به عدم بهینه سازی منجر می شوند، با تجزیه و تحلیل تجزیه و تحلیل فیزیکی تجزیه شده با وضعیت فیزیکی با توجه به اسپاریتی مشخص می شود. دوم، بر اساس مکانیزم خودآموزی، یک روش هوشمند سازی خودآموزی با استفاده از یادگیری تقویتی برای تنظیم خودکار مقادیر تعیین شده متغیرهای کنترل شده علی، پیشنهاد می شود. اقدام خودآزمایی از طریق ساختار بازیگر-کریتیک با دو شبکه عصبی به طور تکراری انجام می شود. به این ترتیب، اقدامات موثر برای اصلاح روند به وضعیت مورد انتظار آن است که فقط نیاز به اطلاعات کوچک دارد. در نهایت، اثربخشی روش پیشنهادی با هر دو مورد عددی و یک فرایند تولید نوع بومی معمولی، یعنی فرآیند قالب گیری تزریقی، نشان داده شده است.
موضوعات مرتبط
مهندسی و علوم پایه شیمی شیمی آنالیزی یا شیمی تجزیه
چکیده انگلیسی
Batch processes have attracted extensive attention as a crucial manufacturing way in modern industries. Although they are well equipped with control devices, batch processes may operate at a non-optimal status because of process disturbances, equipment aging, feedstock variations, etc. As a result, the quality indices or economic benefits may be undesirable using the pre-defined normal operation conditions. And this phenomenon is called non-optimality here. Therefore, it is indispensable to timely remedy the process to its optimal status without accurate models or amounts of data. To solve this problem, this study proposes an intelligent non-optimality self-recovery method based on reinforcement learning. First, the causal variables that lead to the non-optimality are identified by developing a status-degraded Fisher discriminant analysis with consideration of sparsity. Second, on the basis of self-learning mechanism, an intelligent self-recovery method is proposed using the reinforcement learning to automatically adjust the set-points of the causal controlled variables. The self-recovery action is taken iteratively through the Actor-Critic structure with two neural networks. In this way, effective actions are taken to remedy the process to its expected status which only require small data. Finally, the efficacy of the proposed method is illustrated by both numerical case and a typical batch-type manufacturing process, i.e., the injection molding process.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Chemometrics and Intelligent Laboratory Systems - Volume 176, 15 May 2018, Pages 89-100
نویسندگان
, , ,