|
中山大学学报(自然科学版) 2018
融合物品热门因子的协同过滤改进算法Keywords: 协同过滤,皮尔逊相似度,MovieLens数据集,spark平台,热门因子 Abstract: 摘要 协同过滤算法是推荐系统中比较古老的算法,原理是根据近邻用户或者相似物品对目标进行推荐,因此相似度计算方法是关键部分.由于互联网的高传播性,物品热门周期变短,影响了用户之间相似性度量,传统的协同过滤算法已经不能达到很好的推荐效果.针对相似度改进,在皮尔逊相似度原理上添加物品热门因子,优化皮尔逊相似度计算,提高推荐效果.采用大数据技术并搭建spark分布式平台.在spark大数据平台上使用MovieLens电影推荐数据集上验证改进后的算法,采用准确率、召回率和平均绝对误差(MAE)等指标来评价改进算法.实验结果表明改进算法在准确率和召回率上都比传统算法有很大的提高,在平均绝对误差上也有所下降
|