OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

- 2008

基于策略迭代和值迭代的POMDP算法

孙湧仵博冯延蓬

Keywords: [部分可观察Markov决策, 决策算法, 智能体, 值迭代, 策略迭代, POMDP, decision algorithm, agent, value iteration, policy iteration]

Full-Text Cite this paper Add to My Lib

Abstract:

部分可观察Markov决策过程是通过引入信念状态空间将非Ma..

Contact Us

service@oalib.com

WhatsApp +8615387084133