%0 Journal Article %T Q学习算法在库存控制中的应用 %A 吴沧浦 %A 蒋国飞 %J - %D 1999 %K Q学习 %K 马尔可夫决策过程 %K 库存控制 %K 连续状态和决策空间 %K 探索策略 %U http://www.aas.net.cn:80/article/id/16714