Markov,跳变线性系统,策略迭代,Q,函数,直接自适应最优控制, Open Access Library" />
|
控制与决策 2008
基于强化学习的JLQ模型的直接自适应最优控制, PP. 1359-1362 Keywords: Markov,跳变线性系统,策略迭代,Q,函数,直接自适应最优控制')",Markov&searchField=keyword">href="#">Markov,跳变线性系统,策略迭代,Q,函数,直接自适应最优控制 Abstract: 研究离散时间跳变线性二次(JLQ)模型的直接自适应最优控制问题.将强化学习的理论和方法应用于JLQ模型,设计基于Q函数的策略迭代算法,以优化系统性能.在系统参数以及模态跳变概率未知的情况下,Q函数对应的参数矩阵,可通过观察给定策略下系统行为,应用递归最小二乘算法在线估计.基于此参数矩阵,可构造出新的策略使得系统性能更优.该算法可收敛到最优策略.
|