全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM
非平稳MDP平均模型及其滚动式算法

Keywords: 非平稳MDP,平均目标,ε(≥0)-平均最优马氏策略,滚动式算法,最优方程

Full-Text   Cite this paper   Add to My Lib

Abstract:

本文考虑可数状态空间非平稳马尔可夫决策过程(MDP)的平均目标.首先,我们指出并改正了Park,et,al[1]和Alden,etal[2]的错误,并在弱于Park,etal[1]的条件下,借助于新建立的最优方程,证明了最优平均值的收敛性和平均最优马氏策略的存在性.其次,给出了ε(>0)-平均最优马氏策略的滚动式算法.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133