PSR模型,状态经历,判别分析,Q学习, Open Access Library" />
|
控制与决策 2009
基于PSR模型的规划算法, PP. 289-292 Keywords: PSR模型,状态经历,判别分析,Q学习')",PSR模型&searchField=keyword">href="#">PSR模型,状态经历,判别分析,Q学习 Abstract: 提出一种基于PSR模型的规划算法.首先提出了状态经历的概念与发现方法,并进一步用此概念来描述系统的PSR状态.在此基础上,讨论了如何用判别分析方法,确定任意经历下的PSR状态以及如何在该过程中同时获取系统的PSR模型.从而可引入Q学习算法,用于决策当前的最优策略.算法被应用于一些标准的POMDP问题,实验结果验证了所提方法的有效性.
|