%0 Journal Article %T 基于参数探索的期望最大化策略搜索 %A 冯涣婷 %A 王雪松 %A 程玉虎 %J - %D 2012 %R 10.3724/SP.J.1004.2012.00038 %K 策略搜索 %K 强化学习 %K 参数空间 %K 探索 %K 期望最大化 %K 重要采样 %U http://www.aas.net.cn:80/cn/article/doi/10.3724/SP.J.1004.2012.00038