全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于线性平均的强化学习函数估计算法

, PP. 1407-1411

Keywords: 自动控制技术,强化学习,线性平均,函数估计,梯度下降法,自动控制技术,强化学习,线性平均,函数估计,梯度下降法

Full-Text   Cite this paper   Add to My Lib

Abstract:

提出了一种基于最小线性平均的强化学习算法,用于解决连续空间下强化学习函数估计的非收敛性问题。该算法基于梯度下降法,根据压缩映射原理,通过采用线性平均法作为值函数估计的性能衡量标准,把值函数估计的迭代过程转化为一个收敛于不动点的过程。该算法利用强化学习算法的标准问题MountainCar问题进行了验证,仿真结果验证了算法是有效的和可行的,并且可以快速收敛到稳定值。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133