|
- 2020
一种权重平均值的深度双Q网络方法DOI: 10.7544/issn1000-1239.2020.20190159 Keywords: [深度强化学习, 深度Q网络, 估计误差, 权重双估计器, 时间差分, deep reinforcement learning, deep Q-network, estimation error, weighted double estimator, temporal difference] Abstract: 深度强化学习算法的不稳定性和可变性对其性能有重要的影响.深度..
|