|
计算机科学 2007
一种高效的最大频繁embedded子树挖掘算法Keywords: embedded子树频繁子树最大频繁子树闭合频繁子树数据挖掘 Abstract: 提出了一种高效的最大频繁embedded子树挖掘算法——cmpetreeminer。该算法采用先序遍历序列存储树,并将节点的范围属性加入该序列,采用伪投影技术对频繁子序列进行投影,并对投影序列中的每个节点编码。在挖掘带编码的频繁子序列过程中,对频繁子序列进行高效剪枝,得到最大频繁embedded子树,无需生成所有频繁embedded子树。实验结果表明,cmpetreeminer算法是高效可行的。
|