全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

Markov控制过程基于单个样本轨道的在线优化算法

DOI: 10.7641/j.issn.1000-8152.2002.6.010

Keywords: Markov控制过程,Markov性能势,随机平稳策略,在线优化

Full-Text   Cite this paper   Add to My Lib

Abstract:

在Markov性能势理论基础上,研究了Markov控制过程的性能优化算法.不同于传统的基于计算的方法,文中的算法是根据单个样本轨道的仿真来估计性能指标关于策略参数的梯度,以寻找最优(或次优)随机平稳策略.由于可根据不同实际系统的特征来选择适当的算法参数,因此它能满足不同实际工程系统在线优化的需要.最后简要分析了这些算法在一个无限长的样本轨道上以概率1的收敛性,并给出了一个三状态受控Markov过程的数值实例.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133