%0 Journal Article %T mas中基于多奖惩标准的q学习算法研究 %A 乔林 %A 罗杰? %J 计算机科学 %D 2012 %X 传统的q学习算法是基于单奖惩标准的。基于单奖惩标准的q学习算法往往不能适应multi-agentsystem %K q学习算法 %K 多奖惩标准 %K mas %K 三维围捕 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=1200667&flag=1