%0 Journal Article %T 学习过程中共享经验的q学习算法的研究 %A 乔林 %A 罗杰? %J 计算机科学 %D 2012 %X 主要以提高多智能体系统中q学习算法的学习效率为研究目标,以追捕问题为研究平台,提出了一种基于共享经验的q学习算法。该算法模拟人类的团队学习行为,各个智能体拥有共同的最终目标,即围捕猎物,同时每个智能体通过协商获得自己的阶段目标。在学习过程中把学习分为阶段性学习,每学习一个阶段,就进行一次阶段性总结,分享彼此好的学习经验,以便于下一阶段的学习。这样以学习快的、好的带动慢的、差的,进而提升总体的学习性能。仿真实验证明,在学习过程中共享经验的q学习算法能够提高学习系统的性能,高效地收敛于最优策略。 %K q学习算法 %K mas %K 围捕问题 %K 共享经验 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=120551&flag=1