دانلود رایگان مقاله: فرایندهای تصمیم گیری نیمه مارکوف با محدودیت نسبت به پاداش های متوسط

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
5774521	1413561	2017	8 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Semi-Markov decision processes with limiting ratio average rewards

ترجمه فارسی عنوان

فرایندهای تصمیم گیری نیمه مارکوف با محدودیت نسبت به پاداش های متوسط

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

روند تصمیم گیری نیمه مارکوف، محدود کردن بازده متوسط، سیاست نیمه ثابت،

Semi-Markov decision process - روند تصمیم گیری نیمه مارکوف

ترجمه چکیده

ما اثبات می کنیم که یک پروسه تصمیم گیری نیمی مارکف (محدودۀ حالت و عمل) با بازپرداخت مقادیر محدود (عدم تقسیم) بازپرداخت یک سیاست نیمه ثابت مطلوب خالص (یعنی یک سیاست نیمه مارکوف مستقل از شمارش تصادفی تصمیم گیری) است. ما با نشان دادن (با کمک یک نمونه) نتیجه گیری می کنیم که نتیجه نمی تواند بیشتر تقویت شود. یک الگوریتم گام خام، اما گام به گام برای محاسبه چنین سیاست مطلوب داده می شود.

موضوعات مرتبط

مهندسی و علوم پایه ریاضیات آنالیز ریاضی

پیش نمایش مقاله

فرایندهای تصمیم گیری نیمه مارکوف با محدودیت نسبت به پاداش های متوسط

چکیده انگلیسی

We prove that a finite (state and action spaces) semi-Markov decision process with limiting ratio average (undiscounted) payoff has an optimal pure semi-stationary policy (i.e., a semi-Markov policy independent of decision epoch count). We conclude by showing (with the aid of an example) that the result cannot be strengthened further. A crude but finite step algorithm is given to compute such an optimal policy.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Mathematical Analysis and Applications - Volume 455, Issue 1, 1 November 2017, Pages 864-871

نویسندگان

Sagnik Sinha, Prasenjit Mondal,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : فرایندهای تصمیم گیری نیمه مارکوف با محدودیت نسبت به پاداش های متوسط

دسترسی سریع

ارتباط

English Website