%0 Journal Article %T 基于平均强化学习的订单生产方式企业订单接受策略 %A 郝鹃 %A 余建军 %A 周文慧 %J 计算机应用 %D 2013 %X ?从收益管理思想出发,采用平均强化学习算法研究不确定环境下订单生产(mto)方式企业的订单接受问题。以最大化平均期望收益为优化目标,采用多级价格机制,把订单类型、价格和提前期的不同组合作为系统状态划分标准,结合平均强化学习原理,提出了具有学习能力的订单接受算法(rloa)。仿真结果表明,rloa算法具有学习和选择性接受订单的能力,与其他订单接受规则相比,在平均收益、订单类型接受状况和适应性等方面都有较好表现。 %K 订单接受 %K 平均强化学习 %K 订单生产方式企业 %K 收益管理 %U http://www.joca.cn/CN/abstract/abstract16291.shtml