%0 Journal Article
%T 基于多智能体强化学习的多机器人协作策略研究
%A 段勇
%A 徐心和
%J 系统工程理论与实践
%P 1305-1310
%D 2014
%X ？研究了一种基于智能体动作预测的多智能体强化学习算法.在多智能体系统中，学习智能体选择动作不可避免地要受到其他智能体执行动作的影响，因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此，提出使用概率神经网络来预测其他智能体动作的方法，从而构成多智能体联合动作，实现了多智能体强化学习算法.此外，研究了该方法在足球机器人协作策略学习中的应用，使多机器人系统能够通过与环境的交互学习来掌握行为策略，从而实现多机器人的分工和协作.
%K 多智能体系统
%K 强化学习
%K 概率神经网络
%K 多机器人协作
%U http://www.sysengi.com/CN/abstract/abstract110524.shtml