%0 Journal Article %T 基于探索密度的Option子目标发现算法 %A 孟江华 %A 朱纪洪 %A 孙增圻 %J 模式识别与人工智能 %P 236-240 %D 2007 %X 提出状态探索密度的概念,通过检测状态对智能体探索环境能力的影响来发现学习的子目标并构建对应的Option.用该算法创建Option的再励学习算法能有效提高学习速度.算法具有和任务无关、不需要先验知识等优点,构造出的Option在同一环境下不同任务间可以直接共享. %K 递阶再励学习 %K Option %K 探索密度(ED) %U http://manu12.magtech.com.cn/Jweb_prai/CN/abstract/abstract10486.shtml