OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

系统科学与数学 1999

AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM
非平稳MDP平均模型及其滚动式算法

Xian PIng GUO,Jian Yong LIU,Ke LIU,
郭先平

Keywords: 非平稳MDP,平均目标,ε（≥0）－平均最优马氏策略,滚动式算法,最优方程

Full-Text Cite this paper Add to My Lib

Abstract:

本文考虑可数状态空间非平稳马尔可夫决策过程（ＭＤＰ）的平均目标．首先，我们指出并改正了Ｐａｒｋ，ｅｔ，ａｌ［１］和Ａｌｄｅｎ，ｅｔａｌ［２］的错误，并在弱于Ｐａｒｋ,ｅｔａｌ［１］的条件下，借助于新建立的最优方程，证明了最优平均值的收敛性和平均最优马氏策略的存在性．其次，给出了ε（＞０）－平均最优马氏策略的滚动式算法．

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133

AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM非平稳MDP平均模型及其滚动式算法

AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM
非平稳MDP平均模型及其滚动式算法