%0 Journal Article %T 基于强化学习的集装箱码头卡车调度策略研究 %A 尚晶 %A 徐长生 %J 武汉理工大学学报 %D 2011 %X ?研究同时服务于装船和卸船作业的集卡全场调度策略,调度优化目标包括减少岸桥等待集卡的时间以及减少集卡的空载行程。提出了基于?q?学习算法的集卡调度强化学习模型,对其系统状态、动作策略、报酬函数进行分析,并结合小脑模型关节控制器(cmac)神经网络对?q?函数进行泛化和逼近。仿真结果表明,与其他集卡调度策略相比,?q?学习算法的优化效果比较明显,其在保证岸桥连续作业的同时,还能有效减少集卡的空载行程。 %K 集装箱码头 %K 〓强化学习 %K 〓?q?学习 %K 〓集卡调度 %K 〓小脑模型关节控制器 %U http://www.whlgdxxb.com.cn//qikan/Cpaper/zhaiyao.asp?bsid=29581