%0 Journal Article %T 无界报酬折扣模型中ε(≥0)最优策略的性质 %A 董泽清 %J 科学通报 %D 1986 %I %X 我们研究绝对平均相对有界折扣模型{S,(A(i),i∈S),q,r,V_β},其中S,A(i)(i∈S)均为可列集,q是时齐的,r满足 (1)存在数集{r(i):r(i)>0,i∈S}使得 (2)存在数d>0,使得以及V_β是折扣准则。 本文证明的关键是我们引入了如下概念:在策略π下,于时刻n可达的状态;可实现的历史。并引 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=01BA20E8BA813E1908F3698710BBFEFEE816345F465FEBA5&cid=7C7E63796F062382A606A3A9833B8C05&jid=B40D4BA57FF46E45205A09B4DC283152&aid=F58116FE31C94A12CD80D2F579914D53&yid=4E65715CCF57055A&vid=4AD960B5AD2D111A&iid=DF92D298D3FF1E6E&sid=2E15A588990CC690&eid=2E15A588990CC690&journal_id=0023-074X&journal_name=科学通报&referenced_num=0&reference_num=0