|
计算机科学 2005
一种基于前缀树的频繁模式挖掘算法Keywords: 频繁模式挖掘算法前缀关键步骤数据挖掘候选项集动态维护挖掘过程时空效率相关信息深度优先数据结构新算法中节点递归 Abstract: 挖掘频繁模式是许多数据挖掘任务的关键步骤。基于fp—tree的挖掘算法由于无须生成候选项集效率明显高于apriori类算法,但fp—tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件fp—tree,时空效率不高。因此,本文提出一种基于前媛树的新算法。该算法通过引入一种新结构一前媛树(prefixtree)用来压缩存放数据所相关信息,并通过调整前媛树中节点信息和节点链直接在prefixtree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率。
|