Markov,跳变线性系统,策略迭代,Q,函数,直接自适应最优控制, Open Access Library" />

全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于强化学习的JLQ模型的直接自适应最优控制

, PP. 1359-1362

Keywords: Markov,跳变线性系统,策略迭代,Q,函数,直接自适应最优控制')",Markov&searchField=keyword">href="#">Markov,跳变线性系统,策略迭代,Q,函数,直接自适应最优控制

Full-Text   Cite this paper   Add to My Lib

Abstract:

研究离散时间跳变线性二次(JLQ)模型的直接自适应最优控制问题.将强化学习的理论和方法应用于JLQ模型,设计基于Q函数的策略迭代算法,以优化系统性能.在系统参数以及模态跳变概率未知的情况下,Q函数对应的参数矩阵,可通过观察给定策略下系统行为,应用递归最小二乘算法在线估计.基于此参数矩阵,可构造出新的策略使得系统性能更优.该算法可收敛到最优策略.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133