%0 Journal Article %T 大用户直购中基于Q学习算法的多代理两阶段谈判策略 %A 张森林 %A 屈少青 %A 陈皓勇 %A 张浩 %A 荆朝霞 %A 匡卫洪 %J 电力系统自动化 %D 2010 %X 利用多代理对大用户直购电中不同类型交易者的谈判行为进行了模拟,采取基于历史报价数据的Q学习算法增加了代理的自主学习能力,使代理能根据对手动作及时调整己方报价。此外,为保证市场竞争的公平性,提出了基于“谈判+拍卖”的两阶段谈判机制,给予因对谈判形势估计不足致使谈判破裂但又拥有成本优势的发电商再一次出价的机会,使得合同电价反映出不同发电成本间的真实差异,以此激励发电商以降低成本的方式来换取谈判中的主动权。 %K 一对多谈判 %K Q学习算法 %K 电力市场 %K 大用户直购电 %K 双边合同 %U http://www.aeps-info.com/aeps/ch/reader/view_abstract.aspx?file_no=200909180&flag=1