%0 Journal Article %T 一种多移动机器人协作围捕策略 %A 苏治宝 %A 陆际联 %A 童亮 %J 北京理工大学学报 %D 2004 %X 提出一种在连续未知环境中实现多移动机器人协作围捕移动目标的整体方案.围捕包括包围目标和靠近目标,包围目标行为由强化学习算法实现.用状态聚类减小状态空间,利用Q学习算法获得Q值表,根据学习后的Q值表选择动作.对各种行为的输出进行加权求和获得综合行为,实现对移动目标的围捕.仿真实验获得了在不同条件下的围捕结果.结果表明,环境、hunter与prey的速度关系以及prey的逃跑策略对围捕效果都有影响. %K 多机器人 %K 围捕 %K 状态聚类 %K Q学习 %U http://journal.bit.edu.cn/zr/ch/reader/view_abstract.aspx?file_no=20040508&flag=1