%0 Journal Article %T 强化学习研究综述 %A 高阳 %A 陈世福 %A 陆鑫 %J 自动化学报 %P 86-100 %D 2004 %X ?强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类图,分别在马尔可夫环境和非马尔可夫环境下讨论最优搜索型和经验强化型两类算法;然后结合近年来的研究综述了强化学习技术的核心问题,包括部分感知、函数估计、多agent强化学习,以及偏差技术;最后还简要介绍强化学习的应用情况和未来的发展方向. %K 强化学习 %K 部分感知 %K 函数估计 %K 多agent强化学习 %U http://www.aas.net.cn/CN/abstract/abstract16352.shtml