%0 Journal Article %T 进化强化学习及其在机器人路径跟踪中的应用 %A 段勇 %A 崔宝侠 %A 徐心和 %J 控制与决策 %P 532-536 %D 2009 %X 研究了一种基于自适应启发评价(AHC)强化学习的移动机器人路径跟踪控制方法.AHC的评价单元(ACE)采用多层前向神经网络来实现,将TD(λ)算法和梯度下降法相结合来更新神经网络的权值.AHC的动作选择单元(ASE)由遗传算法优化的模糊推理系统(FIS)构成.ACE网络的输出构成二次强化信号,用于指导ASE的学习.最后将所提出的算法应用于移动机器人的行为学习,较好地解决了机器人的复杂路径跟踪问题. %K 强化学习 %K 自适应启发评价 %K 遗传算法 %K 路径跟踪')" %K href="#">强化学习 %K 自适应启发评价 %K 遗传算法 %K 路径跟踪 %U http://www.kzyjc.net:8080/CN/abstract/abstract9444.shtml