全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

决策过程的数值迭代优化

, PP. 108-112

Keywords: 计算机应用,半Markov决策过程,等价无穷小生成子,异步数值迭代,计算机应用,半Markov决策过程,等价无穷小生成子,异步数值迭代

Full-Text   Cite this paper   Add to My Lib

Abstract:

针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括GaussSeidel异步迭代和随机异步迭代,特别是基于样本轨道仿真的数值迭代等,并运用性能势思想对上述算法进行改进。结果表明,该算法可直接适用于连续时间Markov决策过程。最后通过一个数值例子来比较各种算法的特点。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133