OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

北京理工大学学报 2017

基于Stackelberg策略的多Agent强化学习警力巡逻路径规划

DOI: 10.15918/j.tbit1001-0645.2017.01.019

解易,顾益军

Keywords: 巡逻路线规划 Stackelberg强均衡策略多agent 强化学习

Full-Text Cite this paper Add to My Lib

Abstract:

为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题，提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下，规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时性，采用了Stackelberg强均衡策略作为每个agent选择策略的依据.为了验证算法，在多个巡逻任务中进行了测试.定量和定性的实验结果证明了算法的收敛性和有效性

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133