全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

分布式环境下全局序列模式挖掘技术研究

, PP. 0-0

Keywords: 数据挖掘,全局序列模式,语法序列树,项扩展和序列扩展剪枝

Full-Text   Cite this paper   Add to My Lib

Abstract:

由于分布式环境下挖掘全局序列模式常常产生过多候选序列,加大了网络通信代价。为此提出一种基于分布式环境下的全局序列模式快速挖掘算法。该算法将各站点得到的局部序列模式压缩到一种语法序列树上,避免了重复的序列前缀传输;基于合并树中节点序列规则和简单的特点,提出一种项扩展和序列扩展剪枝策略,有效地约减了候选序列,减少了网络传输量,从而快速生成全局序列模式。理论和实验表明,在大数据集环境下该算法性能优越,能够有效地挖掘全局序列模式。

References

[1]  SRIKANT R, AGRAWAL R. Mining sequential patterns: generalizations and performance improvements[C]// Proceedings of the 5th International Conference on EDBT. Heidelberg, Germany: Springer, 1996: 317
[2]  MANNILA H, TOIVONEN H, VERKAMO A I. Discovery of frequent episodes in sequences[C]// Proceedings of the 1st International Conference on KDD. New York, N. Y.,USA: ACM Press,1995:210215

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133