全部 标题 作者 关键词 摘要
Keywords: [强化学习, 时序决策, 优先级扫描, Dyna结构, Dyna-PS, reinforcement learning, sequential decision making, prioritized sweeping, Dyna architecture, Dyna-PS]
Full-Text Cite this paper Add to My Lib
不确定环境的时序决策问题是强化学习研究的主要内容之一,age..
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133