%0 Journal Article %T 一种基于PSO的分层策略搜索算法* %A 彭志平 %A 李绍平 %J 模式识别与人工智能 %P 98-103 %D 2008 %X 针对分层策略梯度强化学习算法(HPGRL)易陷入局部最优点等问题,提出一种分层策略搜索算法(PSOHPS).首先由设计者按照经典分层强化学习MAXQ方法的思想构建子任务分层结构,通过与环境的直接交互,PSOHPS利用具有较强全局搜索能力的粒子群对各复合子任务中的参数化策略进行进化,以获得优化的动作策略.最后以协商僵局消解的实验验证PSOHPS是有效的,其性能明显优于HPGRL. %K 分层强化学习 %K 粒子群优化算法(PSO) %K 分层策略 %K 协商僵局 %U http://manu12.magtech.com.cn/Jweb_prai/CN/abstract/abstract10182.shtml