%0 Journal Article %T 互联电网CPS调节指令动态最优分配Q–学习算法 %A 余涛 %A 王宇名 %A 刘前进 %J 中国电机工程学报 %P 62-69 %D 2010 %X 控制性能标准(controlperformancestandard,CPS)下互联电网调度端的自动发电控制(automaticgenerationcontrol,AGC)指令(简称CPS指令)到各类型AGC机组的动态优化分配是随机最优问题。将CPS指令分配的连续控制过程离散化,并可将其看作是一个离散时间马尔可夫决策过程,提出应用基于Q–学习的动态控制方法。根据优化目标的差异,设计不同的奖励函数,并将其引入到算法当中,有效结合水、火电机组的调节特性,并考虑水电机组的调节裕度,提高AGC系统调节能力。遗传算法和工程实用方法在标准两区域模型及南方电网模型的仿真研究显示,Q–学习有效提高了系统的适应性、鲁棒性和CPS考核合格率。 %K Q–学习 %K 随机最优 %K 离散时间马尔可夫决策过程 %K 控制性能标准 %K 自动发电控制 %U http://www.pcsee.org/CN/abstract/abstract23436.shtml