%0 Journal Article
%T 基于经验指导的深度确定性多行动者-评论家算法
%A 何斌
%A 刘全
%A 姜玉斌
%A 张琳琳
%A 闫岩
%A 陈红名
%J -
%D 2019
%R 10.7544/issn1000-1239.2019.20190155
%X 连续控制问题一直是强化学习研究的一个重要方向.近些年深度学习..
%K [强化学习
%K 深度强化学习
%K 确定性行动者-评论家
%K 经验指导
%K 专家指导
%K 多行动者
%K reinforcement learning
%K deep reinforcement learning
%K deterministic actor-critic
%K experience guiding
%K expert guiding
%K multi-actor]
%U http://crad.ict.ac.cn/CN/10.7544/issn1000-1239.2019.20190155