|
计算机应用研究 2009
Efficient hybrid compression algorithm for data mining
|
Abstract:
针对基于垂直数据格式的关联规则挖掘算法在频繁项集查找过程中,需要在内存中保存大量的事务标志列表,有限的内存容量将成为此类算法的最大瓶颈,提出了一种新的混合压缩算法—HC-DM算法。实验结果表明,将HC-DM算法与dEclat算法相结合,再加上排序步骤,可以显著减少频繁项集挖掘过程中的内存使用量。