کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
5774521 | 1413561 | 2017 | 8 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Semi-Markov decision processes with limiting ratio average rewards
ترجمه فارسی عنوان
فرایندهای تصمیم گیری نیمه مارکوف با محدودیت نسبت به پاداش های متوسط
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
روند تصمیم گیری نیمه مارکوف، محدود کردن بازده متوسط، سیاست نیمه ثابت،
ترجمه چکیده
ما اثبات می کنیم که یک پروسه تصمیم گیری نیمی مارکف (محدودۀ حالت و عمل) با بازپرداخت مقادیر محدود (عدم تقسیم) بازپرداخت یک سیاست نیمه ثابت مطلوب خالص (یعنی یک سیاست نیمه مارکوف مستقل از شمارش تصادفی تصمیم گیری) است. ما با نشان دادن (با کمک یک نمونه) نتیجه گیری می کنیم که نتیجه نمی تواند بیشتر تقویت شود. یک الگوریتم گام خام، اما گام به گام برای محاسبه چنین سیاست مطلوب داده می شود.
موضوعات مرتبط
مهندسی و علوم پایه
ریاضیات
آنالیز ریاضی
چکیده انگلیسی
We prove that a finite (state and action spaces) semi-Markov decision process with limiting ratio average (undiscounted) payoff has an optimal pure semi-stationary policy (i.e., a semi-Markov policy independent of decision epoch count). We conclude by showing (with the aid of an example) that the result cannot be strengthened further. A crude but finite step algorithm is given to compute such an optimal policy.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Mathematical Analysis and Applications - Volume 455, Issue 1, 1 November 2017, Pages 864-871
Journal: Journal of Mathematical Analysis and Applications - Volume 455, Issue 1, 1 November 2017, Pages 864-871
نویسندگان
Sagnik Sinha, Prasenjit Mondal,