%0 Journal Article %T 基于强化学习的订单生产型企业的订单接受策略 %A 王晓欢 %A 王宁宁 %A 樊治平 %J 系统工程理论与实践 %P 3121-3129 %D 2014 %X ?针对订单生产型企业在订单接受决策过程中的不确定性,基于强化学习的思想,在考虑生产成本、延迟惩罚成本以及拒绝成本的前提下,引入顾客等级这一要素,从收益管理的角度建立了基于半马尔可夫决策过程的订单接受模型.在此基础上,提出了基于smart算法的最优订单接受策略求解方法,旨在最大化订单生产型企业的长期利润.仿真实验结果表明:基于smart算法得到的订单接受策略要优于基于先来先服务方法得到的订单接受策略;同时,针对考虑顾客等级的仿真实验及数据分析结果,也验证了引入顾客等级这一要素的必要性和重要性. %K 收益管理 %K 订单接受 %K smart算法 %K 平均利润 %K 强化学习 %U http://www.sysengi.com/CN/abstract/abstract110763.shtml