OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

平均准则问题的即时差分学习算法

, PP. 533-536

Full-Text Cite this paper Add to My Lib

Abstract:

？考虑平均准则随机动态规划(SDP)问题的一族在线即时差分(TD)学习算法.在学习中,平均问题的相对值函数是控制器所要学习的目标函数.所提出的算法是已有的TD(λ)算法及R-学习算法的一种推广.

Contact Us

service@oalib.com

WhatsApp +8615387084133