全部 标题 作者 关键词 摘要
Keywords: 连续时间MDP,离散时间MDP,最优方程
Full-Text Cite this paper Add to My Lib
本文讨论的连续时间MDP(Continuous Time MDP,简记为CTMDP)折扣模型为{S,(A(i),(i),i∈S),q,r,a},其中状态集S可列;行动集A(i)为任意非空集,(i)为其上的σ-代数,它包含A(i)的所有单点集;转移速率族q(j|i,a)满足:i∈S,a∈A(i)均有—∞
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133