OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

控制与决策 2006

基于强化学习算法的多机器人系统的冲突消解策略

, PP. 430-434

任燚,陈宗海

Keywords: 多机器人,过程奖赏,优先扫除,强化学习

Full-Text Cite this paper Add to My Lib

Abstract:

多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段,以收集的目标物数量为系统性能指标,以算法收敛时学习次数为学习速度指标,进行仿真研究,并与基于全局奖赏和Q学习算法等其他9种算法进行比较.结果表明所提出的基于过程奖赏和优先扫除的强化学习算法能显著减少冲突,避免死锁,提高系统整体性能.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133