%0 Journal Article %T 基于经验指导的深度确定性多行动者-评论家算法 %A 何斌 %A 刘全 %A 姜玉斌 %A 张琳琳 %A 闫岩 %A 陈红名 %J - %D 2019 %R 10.7544/issn1000-1239.2019.20190155 %X 连续控制问题一直是强化学习研究的一个重要方向.近些年深度学习.. %K [强化学习 %K 深度强化学习 %K 确定性行动者-评论家 %K 经验指导 %K 专家指导 %K 多行动者 %K reinforcement learning %K deep reinforcement learning %K deterministic actor-critic %K experience guiding %K expert guiding %K multi-actor] %U http://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2019.20190155