Linear programming formulation for non-stationary, finite-horizon Markov decision process models

Article ID	Journal	Published Year	Pages	File Type
5128335	Operations Research Letters	2017	5 Pages	PDF

Abstract

Linear programming (LP) formulations are often employed to solve stationary, infinite-horizon Markov decision process (MDP) models. We present an LP approach to solving non-stationary, finite-horizon MDP models that can potentially overcome the computational challenges of standard MDP solution procedures. Specifically, we establish the existence of an LP formulation for risk-neutral MDP models whose states and transition probabilities are temporally heterogeneous. This formulation can be recast as an approximate linear programming formulation with significantly fewer decision variables.

Keywords

Linear programming