کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6861820 1439258 2018 11 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A proactive decision support method based on deep reinforcement learning and state partition
ترجمه فارسی عنوان
یک روش پشتیبانی پیشگیرانه مبتنی بر یادگیری تقویت عمیق و پارتیشن بندی دولتی
کلمات کلیدی
جریان رویداد، حمایت تصمیم گیری فعال یادگیری تقویت عمیق، پارتیشن دولت،
ترجمه چکیده
داده های بزرگ جریان یک نوع مهم از داده های بزرگ است که ما نیاز به تکنولوژی جدید برای پردازش. دریافت اطلاعات از داده های جریان آنلاین و تصمیم گیری آنلاین می تواند به ما کمک کند ارزش بیشتری از اطلاعات بزرگ به دست آوریم. یک سیستم پشتیبانی پیشگیرانه پیشگیرانه می تواند دولت های آینده را پیش بینی کند و دولت های ناخواسته آینده را با اقدامات پیشگیرانه ای اقدام کند. اما مشکلاتی مانند تغییر دادن توزیع داده ها در داده های جریان داده، ترکیب پیش بینی و تصمیم گیری و فضای حالت بزرگ در تصمیم گیری وجود دارد. در این مقاله، ما پیشنهاد روش پیشگیری فعالانه مبتنی بر یادگیری تقویت عمیق و پارتیشن بندی دولت را پیشنهاد می کنیم. بخش تجزیه و تحلیل پیش بینی استفاده از شبکه های اعتقاد عمیق با روش دو مرحله آموزش افزایشی است. بخش یادگیری تقویت عمیق از شبکه های اعتقاد عمیق به عنوان تقریب تابع استفاده می کند که با روش نیمه شیب شناسی یاد می شود. خارج از سیاست از طریق نمونه گیری مهم پشتیبانی می شود. دو نوع پارتیشن بندی دولت و روش های اجرای موازی برای بهبود عملکرد ارائه شده است. ارزیابی تجربی در نرم افزار کنترل تراکم ترافیک نشان می دهد که این روش در هر دو جهت دقت و کارایی خوب عمل می کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Big streaming data is an important kind of big data which we need new technology to process. Getting knowledge from online streaming data and making decision online can help us get more value from Big data. A proactive decision support system can predict future states and mitigate or eliminate undesired future states by taking some actions proactively. But it is difficult to handle some issues like the data distribution change in streaming data, combination of prediction and decision making, and the huge state space in decision making. In this paper, we propose a proactive decision support method based on deep reinforcement learning and state partition. The predictive analytics part uses deep belief networks with two level incremental training method. The deep reinforcement learning part uses deep belief networks as function approximation which is learned by semi-gradient method. Off-policy is supported through important sampling. Two kinds of state partition and parallel execution methods are proposed to improve the performance. The experimental evaluation in traffic congestion control application shows this method works well in both accuracy and performance.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 143, 1 March 2018, Pages 248-258
نویسندگان
, , ,