کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6864474 1439543 2018 9 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A novel reinforcement learning algorithm for virtual network embedding
ترجمه فارسی عنوان
یک الگوریتم یادگیری تقویت جدید برای تعبیه شبکه مجازی
کلمات کلیدی
ترجمه چکیده
مجازی سازی شبکه، سهم یک شبکه فیزیکی را در بین چندین شبکه مجازی را فعال می کند. تعبیه شبکه مجازی، اثربخشی استفاده از منابع شبکه را تعیین می کند. الگوریتم های نقشه برداری اکتشافی سنتی از روش های استاتیک پیروی می کنند، بنابراین نمی توانند به طور خودکار بهینه سازی شوند، که منجر به تصمیم گیری های غیرقابتی و رتبه بندی می شود. برای حل این مشکل، یک روش یادگیری تقویت کننده را برای تعبیه شبکه مجازی معرفی می کنیم. در این مقاله، یک شبکه سیاستی را بر اساس یادگیری تقویتی طراحی و پیاده سازی می کنیم تا تصمیم گیری های نقشه برداری گره انجام شود. ما برای رسیدن به بهینه سازی به طور خودکار با استفاده از شیوه سیاست گذاری، با آموزش شبکه سیاست با داده های تاریخی بر اساس درخواست های شبکه مجازی، از گرادیان سیاست استفاده می کنیم. برای کسب اطلاعات بیشتر، این کار اولین بار است که از داده های درخواست های تاریخی برای بهینه سازی جاسازی شبکه به صورت خودکار استفاده می کند. عملکرد الگوریتم تعبیه پیشنهاد شده در مقایسه با دو الگوریتم دیگر که از قوانین مصنوعی بر اساس رتبه بندی گره استفاده می کنند، ارزیابی می شود. نتایج شبیه سازی نشان می دهد که یادگیری تقویت کننده ما قادر است از درخواست های تاریخی یاد بگیرد و از دو الگوریتم دیگر جاسازی شده بهتر عمل کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Network virtualization enables the share of a physical network among multiple virtual networks. Virtual network embedding determines the effectiveness of utilization of network resources. Traditional heuristic mapping algorithms follow static procedures, thus cannot be optimized automatically, leading to sub-optimal ranking and embedding decisions. To solve this problem, we introduce a reinforcement learning method to virtual network embedding. In this paper, we design and implement a policy network based on reinforcement learning to make node mapping decisions. We use policy gradient to achieve optimization automatically by training the policy network with the historical data based on virtual network requests. To the best of our knowledge, this work is the first to utilize historical requests data to optimize network embedding automatically. The performance of the proposed embedding algorithm is evaluated in comparison with two other algorithms which use artificial rules based on node ranking. Simulation results show that our reinforcement learning is able to learn from historical requests and outperforms the other two embedding algorithms.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 284, 5 April 2018, Pages 1-9
نویسندگان
, , , , ,