%0 Journal Article %T 基于CMAC网络Sarsa(λ)学习的RoboCup守门员策略 %J 北京工业大学学报 %D 2012 %X 针对RoboCup仿真组足球比赛场上状态复杂多变、同时供决策的信息大多为连续变量、智能体利用现有信息通常无法判断当前状态下最优动作的问题,以守门员为例,首先利用CMAC神经网络对连续状态空间泛化,然后在泛化后的状态上,采用Sarsa(λ)学习算法获取守门员的最优策略.通过在RoboCup仿真平台上进行仿真,实验结果表明,采用基于CMAC的Sarsa(λ)学习算法的守门员,经过一定时间的学习后,防守时间显著增长,防守效果明显优于其他算法,验证了本文所提方案的有效性. %K RoboCup仿真组足球比赛 %K CMAC神经网络 %K 泛化 %K Sarsa(λ)学习算法 %K 最优策略 %U http://www.bjgd.cbpt.cnki.net/WKA/WebPublication/paperDigest.aspx?paperID=42CD7414-507A-4692-80D7-3E7F4CAF2BFE