%0 Journal Article %T 基于多智能体强化学习的多机器人协作策略研究 %A 段勇 %A 徐心和 %J 系统工程理论与实践 %P 1305-1310 %D 2014 %X ?研究了一种基于智能体动作预测的多智能体强化学习算法.在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法.此外,研究了该方法在足球机器人协作策略学习中的应用,使多机器人系统能够通过与环境的交互学习来掌握行为策略,从而实现多机器人的分工和协作. %K 多智能体系统 %K 强化学习 %K 概率神经网络 %K 多机器人协作 %U http://www.sysengi.com/CN/abstract/abstract110524.shtml