%0 Journal Article %T 开环可重入排队网络的递阶增强型学习调度 %J 系统工程理论与实践 %P 76-80 %D 2002 %X ?对平均费用型马氏决策过程,研究了一种递阶增强型学习算法;并将算法应用于一个两台机器组成的开环可重入生产系统,计算机仿真结果表明,调度结果优于熟知的启发式调度策略. %K 马尔可夫决策过程 %K 递阶 %K 增强型学习 %K 调度 %U http://www.sysengi.com/CN/abstract/abstract107498.shtml