%0 Journal Article %T 基于PSR模型的规划算法 %A 刘云龙 %A 李人厚 %A 刘建书 %J 控制与决策 %P 289-292 %D 2009 %X 提出一种基于PSR模型的规划算法.首先提出了状态经历的概念与发现方法,并进一步用此概念来描述系统的PSR状态.在此基础上,讨论了如何用判别分析方法,确定任意经历下的PSR状态以及如何在该过程中同时获取系统的PSR模型.从而可引入Q学习算法,用于决策当前的最优策略.算法被应用于一些标准的POMDP问题,实验结果验证了所提方法的有效性. %K PSR模型 %K 状态经历 %K 判别分析 %K Q学习')" %K href="#">PSR模型 %K 状态经历 %K 判别分析 %K Q学习 %U http://www.kzyjc.net:8080/CN/abstract/abstract9396.shtml