|
计算机科学 2007
基于敏捷分桶的频繁项目集生成新算法Keywords: 数据挖掘频繁项目集hash函数hash冲突敏捷分桶 Abstract: 指出用于数据挖掘的频繁项目集生成的常规hash算法存在两个主要缺点:1)难挑选合适的hash函数,2)易导致hash冲突。为了克服了这些缺点,提出了一种能动态适应频繁项目集生成实际需要的敏捷分桶新算法,该算法对任何项目集均有按需反应能力,且无需寻找任何hash函数,更不会导致任何hash冲突。同时给出了进一步改进和提高新算法效率的研究方向。
|