%0 Journal Article %T 分布式序列模式发现算法的研究 %A 邹翔? %A 张巍? %A 刘洋? %A 蔡庆生? %J 软件学报 %P 1262-1269 %D 2005 %X 提出算法fdmsp(fastdistributedminingofsequentialpatterns),以解决分布式环境下的序列模式挖掘问题.首先对分布式环境下序列模式的性质进行了分析.算法采用前缀投影技术划分模式搜索空间,利用序列模式前缀指定选举站点统计序列的全局支持计数,利用局部约减、选举约减、计数约减等方法减少候选序列数,同时将算法分为3个子过程异步运行,使得算法具有较低的i/o开销、内存开销和通信开销,从而高效地生成全局序列模式.实验结果显示,在具有海量数据的局域网环境中,fdmsp算法的性能优于将数据集中后采用gsp算法68.5%~99.5%,并且fdmsp算法具有良好的可伸缩性. %K 数据挖掘 %K 序列模式 %K 分布式算法 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=20050708&flag=1