دانلود رایگان مقاله: کران بهبودیافته در بدترین پیچیدگی مورد تکرار سیاست

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
1142229	957137	2016	6 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Improved bound on the worst case complexity of Policy Iteration

ترجمه فارسی عنوان

کران بهبودیافته در بدترین پیچیدگی مورد تکرار سیاست

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

سیاست اصلاح؛ پیچیدگی؛ فرایند تصمیم مارکوف؛ جهت گیری سینک بدون دور منحصر به فرد

Policy iteration - تکرار سیاست Markov decision process - روند تصمیم گیری مارکوف Complexity - پیچیدگی

موضوعات مرتبط

مهندسی و علوم پایه ریاضیات ریاضیات گسسته و ترکیبات

پیش نمایش مقاله

کران بهبودیافته در بدترین پیچیدگی مورد تکرار سیاست

چکیده انگلیسی

Solving Markov Decision Processes is a recurrent task in engineering which can be performed efficiently in practice using the Policy Iteration algorithm. Regarding its complexity, both lower and upper bounds are known to be exponential (but far apart) in the size of the problem. In this work, we provide the first improvement over the now standard upper bound from Mansour and Singh (1999). We also show that this bound is tight for a natural relaxation of the problem.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Operations Research Letters - Volume 44, Issue 2, March 2016, Pages 267–272

نویسندگان

Romain Hollanders, Balázs Gerencsér, Jean-Charles Delvenne, Raphaël M. Jungers,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : کران بهبودیافته در بدترین پیچیدگی مورد تکرار سیاست

دسترسی سریع

ارتباط

English Website