%0 Journal Article
%T AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM<br>非平稳MDP平均模型及其滚动式算法
%A Xian PIng GUO
%A Jian Yong LIU
%A Ke LIU
%A <br>郭先平
%J 系统科学与数学
%D 1999
%I 
%X 本文考虑可数状态空间非平稳马尔可夫决策过程（ＭＤＰ）的平均目标．首先，我们指出并改正了Ｐａｒｋ，ｅｔ，ａｌ［１］和Ａｌｄｅｎ，ｅｔａｌ［２］的错误，并在弱于Ｐａｒｋ,ｅｔａｌ［１］的条件下，借助于新建立的最优方程，证明了最优平均值的收敛性和平均最优马氏策略的存在性．其次，给出了ε（＞０）－平均最优马氏策略的滚动式算法．
%K 非平稳MDP
%K 平均目标
%K ε（≥0）－平均最优马氏策略
%K 滚动式算法
%K 最优方程
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=6E709DC38FA1D09A4B578DD0906875B5B44D4D294832BB8E&cid=37F46C35E03B4B86&jid=0CD45CC5E994895A7F41A783D4235EC2&aid=92A37C5008CC2B2FDC890B5A08E82452&yid=B914830F5B1D1078&vid=2A8D03AD8076A2E3&iid=E158A972A605785F&sid=AC2617B68B137D9D&eid=BD7D27247C63490C&journal_id=1000-0577&journal_name=系统科学与数学&referenced_num=0&reference_num=0