%0 Journal Article
%T Multi-step backtrack Q-learning based dynamic optimal algorithm for auto generation control order dispatch<br>基于多步回溯Q学习的自动发电控制指令动态优化分配算法
%A YU Tao
%A WANG Yu-ming
%A ZHEN Wei-guo
%A YE Wen-jia
%A LIU Qian-jin
%A <br>余涛
%A 王宇名
%A 甄卫国
%A 叶文加
%A 刘前进
%J 控制理论与应用
%D 2011
%I 
%X 单步Q学习在火电占优、机组时延较大的自动发电控制(AGC) 功率指令动态优化分配中的应用表现出收敛速度慢等不足而影响最优策略的获取. 具有多步预见能力的多步回溯Q学习(Q(λ))显式利用资格迹进行高效回溯操作, 能够有效解决火电机组大时滞环节带来的延时回报问题, 算法平均收敛时间较Q学习缩短50%以上. 算法奖励函数引入调节费用一项, 形成多目标动态最优控制. 两区域模型及南方电网模型仿真研究分析显示, Q(λ)算法在随机、大负荷扰动的复杂系统环境中有效提高系统控制性能标准(CPS)控制品质和适应性, 并且在保证CPS合格率的前提下, 使AGC调节费用下降超过5%.
%K Q(λ)学习
%K 自动发电控制
%K 控制性能标准
%K 随机最优
%K 调节费用
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=970898A57DFC021F93AB51667BAED7F7&aid=4EEC901F61BE6FD30FC82FEFB57A4D86&yid=9377ED8094509821&vid=D3E34374A0D77D7F&iid=CA4FD0336C81A37A&sid=9FFCC7AF50CAEBF7&eid=0401E2DB1F51F8DE&journal_id=1000-8152&journal_name=控制理论与应用&referenced_num=0&reference_num=0