%0 Journal Article
%T AVERAGE MODEL IN NONHOMOGENEOUS MARKOV DECISION PROCESSES AND ROLLING HORIZON ALGORITHM
非平稳MDP平均模型及其滚动式算法
%A Xian PIng GUO
%A Jian Yong LIU
%A Ke LIU
%A
郭先平
%J 系统科学与数学
%D 1999
%I
%X 本文考虑可数状态空间非平稳马尔可夫决策过程(MDP)的平均目标.首先,我们指出并改正了Park,et,al[1]和Alden,etal[2]的错误,并在弱于Park,etal[1]的条件下,借助于新建立的最优方程,证明了最优平均值的收敛性和平均最优马氏策略的存在性.其次,给出了ε(>0)-平均最优马氏策略的滚动式算法.
%K 非平稳MDP
%K 平均目标
%K ε(≥0)-平均最优马氏策略
%K 滚动式算法
%K 最优方程
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=6E709DC38FA1D09A4B578DD0906875B5B44D4D294832BB8E&cid=37F46C35E03B4B86&jid=0CD45CC5E994895A7F41A783D4235EC2&aid=92A37C5008CC2B2FDC890B5A08E82452&yid=B914830F5B1D1078&vid=2A8D03AD8076A2E3&iid=E158A972A605785F&sid=AC2617B68B137D9D&eid=BD7D27247C63490C&journal_id=1000-0577&journal_name=系统科学与数学&referenced_num=0&reference_num=0