%0 Journal Article %T 基于分层强化学习的多移动机器人避障算法 %A 祖丽楠 %A 田彦涛 %A 梅昊 %J 吉林大学学报(工学版) %P 108-112 %D 2006 %X 介绍了一种基于分层思想的强化学习方法,即将机器人的复杂行为分解为一系列简单的行为进行离线独立学习,并分别设计了每个层次的结构、参数及函数。这种学习方法能够减小状态空间并简化强化函数的设计,从而提高了学习的速率以及学习结果的准确性,并使学习过程实现了决策的逐步求精。最后以多机器人避障为任务模型,将避障问题分解为躲避静态和动态障碍物以及向目标点靠近3个子行为分别进行学习,实现了机器人的自适应行为融合,并利用仿真实验对其有效性进行了验证。 %U http://xuebao.jlu.edu.cn/gxb/CN/Y2006/V36/I增刊2/108