%0 Journal Article %T 基于RPkNN-Sarsa(λ)强化学习的机器人路径规划方法 %A 王军红 %A 江 虹 %A 黄玉清 %A 伍晓利 %J 计算机应用研究 %D 2013 %I %X 基于kNN-Sarsaλ强化学习的机器人路径规划方法虽然收敛速度快, 但该算法容易陷入局部最优值, 且未考虑环境信息的不完全可观测性。为此, 设计了一种随机扰动random perturbationkNN-Sarsaλ强化学习算法, 利用Bayesian规则对传感器探测信息的不确定性进行了处理, 建立了基于栅格地图的仿真环境模型。仿真实验结果表明, 该方法不仅收敛性好, 能有效缓解kNN-Sarsaλ算法易陷入局部最优的现象, 且在传感器探测信息不确定的情况下仍能搜索到最优路径。 %K 路径规划 %K 强化学习 %K 随机扰动 %K 传感器探测信息不确定性 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=A9D9BE08CDC44144BE8B5685705D3AED&aid=51EFA6F8AD10024351933A1657A34F7D&yid=FF7AA908D58E97FA&vid=340AC2BF8E7AB4FD&iid=CA4FD0336C81A37A&sid=FCD27DC5E1F2EEE7&eid=BC084ACE66B62CC8&journal_id=1001-3695&journal_name=计算机应用研究&referenced_num=0&reference_num=9