OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

基于状态集结的值函数逼近

Full-Text Cite this paper Add to My Lib

Abstract:

用更为紧凑的方法表示和存贮值函数，以求解大规模平均模型Ｍａｒｋｏｖ决策规划（ＭＤＰ）问题。通过状态集结相对值迭代算法逼近值函数，用Ｓｐａｎ半范数和压缩映原理分析算法的收敛性。给出了状态集结后的Ｂｅｌｌｍａｎ最优方程。在Ｓｐａｎ压缩条件下了该算法的收敛性，同时还给出了其误差估计。

Contact Us

service@oalib.com

WhatsApp +8615387084133