%0 Journal Article %T 结构化状态空间中的递阶再励学习方法 %A 孟江华 %A 朱纪洪 %A 孙增圻 %J 控制与决策 %P 233-237 %D 2007 %X 在状态空间满足结构化条件的前提下,通过状态空间的维度划分直接将复杂的原始MDP问题递阶分解为一组简单的MDP或SMDP子问题,并在线对递阶结构进行完善.递阶结构中嵌入不同的再励学习方法可以形成不同的递阶学习.所提出的方法在具备递阶再励学习速度快,易于共享等优点的同时,降低了对先验知识的依赖程度,缓解了学习初期回报值稀少的问题. %K 再励学习(RL) %K 递阶再励学习 %K 结构化状态空间 %U http://www.kzyjc.net:8080/CN/abstract/abstract9060.shtml