全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

一种快速强化学习方法研究

Keywords: 强化学习,资格迹,SARSA(λ)算法,DFSARSA(λ)算法

Full-Text   Cite this paper   Add to My Lib

Abstract:

在对资格迹理论研究的基础上,提出了一种延迟快速强化学习算法DFSARSA(λ)(延迟快速SARSA(λ)算法).算法的主要思想是通过对资格迹的重新定义和对即时差分TD(λ)偏差的跟踪,使强化学习中Q值在需要时进行更新,而SARSA(λ)每一步都对Q值进行更新,该方法使SARSA(λ)算法的更新计算复杂度从O(|S||A|)降到了O(|A|),提高了强化学习速度,仿真实验证明了该算法的有效性.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133