%0 Journal Article %T 平均准则问题的即时差分学习算法 %A 吴沧浦 %A 胡光华 %J - %D 2000 %K 即时差分学习 %K 强化学习 %K 动态规划 %K Monte Carlo方法 %U http://www.aas.net.cn:80/article/id/16555