%0 Journal Article %T 基于多步回溯Q(λ)学习的电网多目标最优碳流算法 %A 余涛 %A 张孝顺 %A 郑理民 %J 电力系统自动化 %D 2014 %X 为弥补传统最优潮流计算中缺少对电力网络的碳排放优化控制,文中利用基于潮流计算结果的碳流模型,提出了一种基于半马尔可夫决策过程的Q(λ)学习算法,把潮流问题中的约束、可控变量转换成算法的状态和动作,并以线性加权方式把碳流损耗、网损和电压稳定分量转化为奖励函数,通过不断试错与迭代来动态寻找最优动作策略。将该算法在IEEE 57节点标准算例中进行了验证,取得了良好效果,为解决电网多目标最优碳流问题提供了一种可行、有效的方法 %K Q(λ)学习 %K 最优碳流 %K 多目标优化 %K 强化学习 %K Q(λ)learning %K optimal carbon emission flow %K multi-objective optimization %K reinforcement learning %U http://www.aeps-info.com/aeps/article/abstract/20140513010?st=article_issue