%0 Journal Article
%T 一般和博弈中的合作多agent学习
%A 宋梅萍
%A 顾国昌
%A 张国印
%A 刘海波
%J 控制理论与应用
%D 2007
%R 10.7641/j.issn.1000-8152.2007.2.029
%X 理性和收敛是多agent学习研究所追求的目标.在理性合作的agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性.另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能.
%K 多agent学习
%K 一般和随机博弈
%K Nash平衡
%K Pareto占优
%K Q-学习
%U http://jcta.alljournals.ac.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=200702029&flag=1