%0 Journal Article %T 基于数据的自学习优化控制:研究进展与展望 %A 刘德荣 %A 李宏亮 %A 王鼎 %J 自动化学报 %P 1858-1870 %D 2013 %R 10.3724/SP.J.1004.2013.01858 %X ?自适应动态规划(Adaptivedynamicprogramming,ADP)方法可以解决传统动态规划中的"维数灾"问题,已经成为控制理论和计算智能领域最新的研究热点.ADP方法采用函数近似结构来估计系统性能指标函数,然后依据最优性原理来获得近优的控制策略.ADP是一种具有学习和优化能力的智能控制方法,在求解复杂非线性系统的最优控制问题中具有极大的潜力.本文对ADP的理论研究、算法实现、相关应用等方面进行了全面的梳理,涵盖了最新的研究进展,并对ADP的未来发展趋势进行了分析和展望. %K 自适应动态规划 %K 近似动态规划 %K 强化学习 %K 神经网络 %K 智能控制 %U http://www.aas.net.cn/CN/abstract/abstract18225.shtml