کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4951261 1441199 2017 27 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Trading performance for stability in Markov decision processes
ترجمه فارسی عنوان
عملکرد بازرگانی برای ثبات در فرآیند تصمیم گیری مارکوف
کلمات کلیدی
فرایندهای تصمیم گیری مارکوف، بازده متوسط، ثبات، سیستم های تصادفی سنتز کنترل کننده،
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی


- We show that optimizing mean payoff and stability requires memory and randomization.
- We show how to reduce existence of optimal strategies to a constrained problem.
- We give a complexity classification for the problem of finding an optimal strategy.

We study controller synthesis problems for finite-state Markov decision processes, where the objective is to optimize the expected mean-payoff performance and stability (also known as variability in the literature). We argue that the basic notion of expressing the stability using the statistical variance of the mean payoff is sometimes insufficient, and propose an alternative definition. We show that a strategy ensuring both the expected mean payoff and the variance below given bounds requires randomization and memory, under both the above definitions. We then show that the problem of finding such a strategy can be expressed as a set of constraints.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Computer and System Sciences - Volume 84, March 2017, Pages 144-170
نویسندگان
, , , ,