%0 Journal Article %T 搬运系统作业分配问题的小脑模型关节控制器Q学习算法 %A 唐昊 %A 丁丽洁 %A 程文娟 %A 周雷 %J 控制理论与应用 %D 2009 %R 10.7641/j.issn.1000-8152.2009.8.CCTA080522 %X 研究两机器人高速搬运系统的作业分配问题.在系统的Markov决策过程(MDP)模型中,状态变量具有连续取值和离散取值的混杂性,状态空间复杂且存在“维数灾”问题,传统的数值优化难以进行.根据小脑模型关节控制器(CMAC)具有收敛速度快和适应性强的特点,运用该结构作为Q值函数的逼近器,并与Q学习和性能势概念相结合,给出了一种适用于平均或折扣性能准则的CMAC-Q学习优化算法.仿真结果说明,这种神经元动态规划方法比常规的Q学习算法具有节省存储空间,优化精度高和优化速度快的优势. %K 作业分配 %K Markov决策过程 %K Q学习 %K CMAC %U http://jcta.alljournals.ac.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA080522&flag=1