%0 Journal Article
%T 基于状态集结的值函数逼近
%J 北京理工大学学报
%D 2000
%X 用更为紧凑的方法表示和存贮值函数，以求解大规模平均模型Ｍａｒｋｏｖ决策规划（ＭＤＰ）问题。通过状态集结相对值迭代算法逼近值函数，用Ｓｐａｎ半范数和压缩映原理分析算法的收敛性。给出了状态集结后的Ｂｅｌｌｍａｎ最优方程。在Ｓｐａｎ压缩条件下了该算法的收敛性，同时还给出了其误差估计。
%K 动态规划
%K 状态集结
%K 随机控制
%K 值函数逼近
%U http://journal.bit.edu.cn/zr/ch/reader/view_abstract.aspx?file_no=20000388&flag=1