%0 Journal Article %T 基于Q学习的互联电网动态最优CPS控制 %A 余涛 %A 周斌 %A 陈家荣 %J 中国电机工程学报 %P 13-19 %D 2009 %X 控制性能标准(controlperformancestandard,CPS)下互联电网自动发电控制(automaticgenerationcontrol,AGC)系统是一个典型的不确定随机系统,应用基于马尔可夫决策过程(Markovdecisionprocess,MDP)理论的Q学习算法可有效地实现控制策略的在线学习和动态优化决策。将CPS值作为包含AGC的电力系统“环境”所给的“奖励”,依靠Q值函数与CPS控制动作形成的闭环反馈结构进行交互式学习,学习目标为使CPS动作从环境中获得的长期积累奖励值最大。提出一种实用的半监督群体预学习方法,解决了Q学习控制器在预学习试错阶段的系统镇定和快速收敛问题。仿真研究表明,引入基于Q学习的CPS控制可显著增强整个AGC系统的鲁棒性和适应性,有效提高了CPS的考核合格率。 %K 自动发电控制 %K Q学习 %K 马尔可夫决策过程 %K 控制性能标准 %K 最优控制 %U http://www.pcsee.org/CN/abstract/abstract22953.shtml