%0 Journal Article %T 一种权重平均值的深度双Q网络方法 %A 刘全 %A 闫岩 %A 陈松 %A 吴金金 %J - %D 2020 %R 10.7544/issn1000-1239.2020.20190159 %X 深度强化学习算法的不稳定性和可变性对其性能有重要的影响.深度.. %K [深度强化学习 %K 深度Q网络 %K 估计误差 %K 权重双估计器 %K 时间差分 %K deep reinforcement learning %K deep Q-network %K estimation error %K weighted double estimator %K temporal difference] %U http://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2020.20190159