%0 Journal Article %T AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM
非平稳MDP平均模型及其滚动式算法 %A Xian PIng GUO %A Jian Yong LIU %A Ke LIU %A
郭先平 %J 系统科学与数学 %D 1999 %I %X 本文考虑可数状态空间非平稳马尔可夫决策过程(MDP)的平均目标.首先,我们指出并改正了Park,et,al[1]和Alden,etal[2]的错误,并在弱于Park,etal[1]的条件下,借助于新建立的最优方程,证明了最优平均值的收敛性和平均最优马氏策略的存在性.其次,给出了ε(>0)-平均最优马氏策略的滚动式算法. %K 非平稳MDP %K 平均目标 %K ε(≥0)-平均最优马氏策略 %K 滚动式算法 %K 最优方程 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=6E709DC38FA1D09A4B578DD0906875B5B44D4D294832BB8E&cid=37F46C35E03B4B86&jid=0CD45CC5E994895A7F41A783D4235EC2&aid=92A37C5008CC2B2FDC890B5A08E82452&yid=B914830F5B1D1078&vid=2A8D03AD8076A2E3&iid=E158A972A605785F&sid=AC2617B68B137D9D&eid=BD7D27247C63490C&journal_id=1000-0577&journal_name=系统科学与数学&referenced_num=0&reference_num=0