کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10127504 1645055 2018 7 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
The average cost of Markov chains subject to total variation distance uncertainty
ترجمه فارسی عنوان
میانگین هزینه زنجیره مارکوف به دلیل عدم اطمینان فاصله کل تغییرات
کلمات کلیدی
ترجمه چکیده
در این مقاله مسئله کنترل یک زنجیره مارکوف به طوری که به حداقل رساندن هزینه میانگین در نظر گرفته شده در مدت زمان واحد در زمان زمانی که توزیع نامحدود ناشناخته است، اما ما می دانیم آن متعلق به یک مجموعه نامشخص داده می شود. مدل ریاضی مورد استفاده برای توصیف این مجموعه، عدم قطعیت فاصله کل تغییرات است. ما نشان می دهیم که سیاست کنترل تعادلی، که احتمال بیشتری را به ایالات با هزینه پایین و احتمال کمتر به ایالات با هزینه های بالا ارائه می دهد، یک سیاست کنترل بهینه است که هزینه متوسط ​​را به حداقل می رساند. شناخت چنین سیاستی ممکن است در شرایط عملی با محدودیت هایی که در اینجا مورد مطالعه قرار می گیرد، ارزشمند باشد، در حالی که توزیع غیرمستقیم نامعلوم است و به طور آنلاین نیازمند یک سیاست کنترل مطلوب است.
موضوعات مرتبط
مهندسی و علوم پایه سایر رشته های مهندسی کنترل و سیستم های مهندسی
چکیده انگلیسی
This paper addresses the problem of controlling a Markov chain so as to minimize the long-run expected average cost per unit time when the invariant distribution is unknown but we know it belongs to a given uncertain set. The mathematical model used to describe this set is the total variation distance uncertainty. We show that the equilibrium control policy, which yields higher probability to the states with low cost and lower probability to the states with the high cost, is an optimal control policy that minimizes the average cost. Recognition of such a policy may be of value in practical situations with constraints consistent to those studied here when the invariant distribution is uncertain and deriving online an optimal control policy is required.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Systems & Control Letters - Volume 120, October 2018, Pages 29-35
نویسندگان
, , ,