%0 Journal Article
%T mas中基于多奖惩标准的q学习算法研究
%A 乔林
%A 罗杰？
%J 计算机科学
%D 2012
%X 传统的q学习算法是基于单奖惩标准的。基于单奖惩标准的q学习算法往往不能适应multi-agentsystem
%K q学习算法
%K 多奖惩标准
%K mas
%K 三维围捕
%U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=1200667&flag=1