|
重庆邮电大学学报(自然科学版) 2015
云计算环境下基于张量分解的缺失关联规则挖掘算法Keywords: 分布式发现,缺失关联规则,云计算,张量分解,共轭梯度算法 Abstract: 针对云计算环境下由于数据缺失导致关联规则发现误差较高的问题,提出一种基于张量分解的缺失关联规则分布式发现算法,从而建模关联规则、缺失数据并近似它们的置信度。利用Apriori算法进行局部数据相关以获得频繁项集,通过CANDECOMP/PARAFAC(CP)分解方法分解张量置信度,使用共轭梯度算法进行迭代以最小化近似张量的成本,当存在缺失数据的情况下,利用分布式算法将局部相关与全局相关结合发现缺失关联规则。仿真结果显示,算法的平均误差仅为5.55%,最大误差不超过10%,低于其他几种较新的缺失关联规则算法,相比基于聚类的关联规则算法,平均执行时间减少了16.5%。结果表明,所提基于张量分解的分布式算法在缺失数据的情况下,性能优于其他的关联规则算法,能更加有效地提供缺失规则置信度的近似解。
|