%0 Journal Article %T PARTIALLY OBSERVABLE MARKOV DECISION PROGRAMMING WITH STOCHASTIC DISCOUNT FACTORS
随机折扣部分可观察马尔可夫决策规划 %A 刘迪芬 %J 系统科学与数学 %D 1993 %I %X 一、引言考虑一个部分可观察马尔可夫决策规划模型(简记为 POMDP),并引文1]中所用的定义、记号(只将δ_N 换成∏,(?)换成 A)和有关结论.于是信息向量 π(t)与 π(t 1)有如下关系 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=6E709DC38FA1D09A4B578DD0906875B5B44D4D294832BB8E&cid=37F46C35E03B4B86&jid=0CD45CC5E994895A7F41A783D4235EC2&aid=A69721711A0305F9DAD5397C0EBF2201&yid=D418FDC97F7C2EBA&vid=FC0714F8D2EB605D&iid=0B39A22176CE99FB&sid=04445C1D2BDA24EE&eid=BA79719BCA7341D5&journal_id=1000-0577&journal_name=系统科学与数学&referenced_num=2&reference_num=0