|
科学通报 1989
连续时间MDP及其与离散时间MDP的关系, PP. 408-408 Keywords: 连续时间马氏决策规划,离散时间马氏决策规划,最优方程 Abstract: 本文讨论的连续时间MDP(ContinuousTimeMDP,简记为CTMDP)折扣模型为{S,(A(i),(i),i∈S),q,r,a},其中状态集S可列;行动集A(i)为任意非空集,(i)为其上的σ-代数,它包含A(i)的所有单点集;转移速率族q(j|i,a)满足i∈S,a∈A(i)均有—∞
|