|
控制与决策 2006
可数半Markov决策过程折扣代价性能优化, PP. 933-936 Keywords: 可数半Markov决策过程,折扣性能准则,折扣Poisson方程,α-势,最优性方程 Abstract: 讨论一类可数半Markov决策过程(CSMDP)在折扣代价准则下的性能优化问题.运用等价Markov过程方法,定义了折扣Poisson方程,并由该方程定义了α-势.于α-势,导出了由最优平稳策略所满足的最优性方程.较为详细地讨论了最优性方程解的存在性问题,并给出了其解存在的一些充分条件.
|