%0 Journal Article %T 分布式环境下全局序列模式挖掘技术研究 %A 胡孔法 %A 张长海 %A  陈 %A 宋爱波 %A 达庆利 %J 计算机集成制造系统 %P 0-0 %D 2007 %X 由于分布式环境下挖掘全局序列模式常常产生过多候选序列,加大了网络通信代价。为此提出一种基于分布式环境下的全局序列模式快速挖掘算法。该算法将各站点得到的局部序列模式压缩到一种语法序列树上,避免了重复的序列前缀传输;基于合并树中节点序列规则和简单的特点,提出一种项扩展和序列扩展剪枝策略,有效地约减了候选序列,减少了网络传输量,从而快速生成全局序列模式。理论和实验表明,在大数据集环境下该算法性能优越,能够有效地挖掘全局序列模式。 %K 数据挖掘 %K 全局序列模式 %K 语法序列树 %K 项扩展和序列扩展剪枝 %U http://www.cims-journal.cn/CN/abstract/abstract1763.shtml