%0 Journal Article
%T 开环可重入排队网络的递阶增强型学习调度
%J 系统工程理论与实践
%P 76-80
%D 2002
%X ？对平均费用型马氏决策过程,研究了一种递阶增强型学习算法;并将算法应用于一个两台机器组成的开环可重入生产系统,计算机仿真结果表明,调度结果优于熟知的启发式调度策略.
%K 马尔可夫决策过程
%K 递阶
%K 增强型学习
%K 调度
%U http://www.sysengi.com/CN/abstract/abstract107498.shtml