%0 Journal Article %T 融合环境模型与深度强化学习的游戏算法 %J - %D 2018 %R 10.13265/j.cnki.jxlgdxxb.2018.03.015 %X 针对基于深度强化学习的游戏算法在训练Agent过程存在的训练速度慢的问题,提出一种新的融合了环境模型与深度强化学习的游戏算法. 该算法考虑到Agent以前执行过相关任务的经验的重要性,并将这些任务经验转化为环境模型. 首先Agent从环境模型中学习,待Agent从环境模型中学习后,然后再与环境交互. 这样可以让Agent少犯错误,加快Agent的学习速度.为了验证算法有效性,在ALE游戏平台上选取两部游戏进行两种算法的仿真实验. 实验结果表明新的算法在选取的两部游戏中都可以有效的提高Agent的训练速度 %K 深度强化学习 %K 环境模型 %K ALE游戏平台 %U http://jxlgdxxb.paperopen.com/upload/html/201803015.html