%0 Journal Article %T 一种快速强化学习方法研究 %A 童亮 %A 陆际联 %A 龚建伟 %J 北京理工大学学报 %D 2005 %X 在对资格迹理论研究的基础上,提出了一种延迟快速强化学习算法DFSARSA(λ)(延迟快速SARSA(λ)算法).算法的主要思想是通过对资格迹的重新定义和对即时差分TD(λ)偏差的跟踪,使强化学习中Q值在需要时进行更新,而SARSA(λ)每一步都对Q值进行更新,该方法使SARSA(λ)算法的更新计算复杂度从O(|S||A|)降到了O(|A|),提高了强化学习速度,仿真实验证明了该算法的有效性. %K 强化学习 %K 资格迹 %K SARSA(λ)算法 %K DFSARSA(λ)算法 %U http://journal.bit.edu.cn/zr/ch/reader/view_abstract.aspx?file_no=20050412&flag=1