%0 Journal Article %T 可数半Markov决策过程折扣代价性能优化 %A 殷保群 %A 李衍杰 %A 周亚平 %A 奚宏生 %J 控制与决策 %P 933-936 %D 2006 %X 讨论一类可数半Markov决策过程(CSMDP)在折扣代价准则下的性能优化问题.运用等价Markov过程方法,定义了折扣Poisson方程,并由该方程定义了α-势.于α-势,导出了由最优平稳策略所满足的最优性方程.较为详细地讨论了最优性方程解的存在性问题,并给出了其解存在的一些充分条件. %K 可数半Markov决策过程 %K 折扣性能准则 %K 折扣Poisson方程 %K α-势 %K 最优性方程 %U http://www.kzyjc.net:8080/CN/abstract/abstract9241.shtml