|
重庆邮电大学学报(自然科学版) 2011
一种改进KNN个性化邮件过滤的方法Keywords: 个性化,KNN算法,邮件过滤,用户兴趣,垃圾邮件 Abstract: 针对个性化邮件过滤中接收的邮件没有规律、正常邮件和垃圾邮件存在严重类偏移等问题,提出一种改进的k最近邻(knearestneighboralgorithm,KNN)个性化邮件过滤方法。该方法主要是通过建立兴趣度模型(对兴趣度计算的改进,剔除用户习惯对建立兴趣度模型带来的影响)不断改变训练集,使得训练集中的文本始终代表用户最近的兴趣。然后通过对接收邮件的无规律和类偏移问题的研究,提出一种改进的KNN算法,该算法主要是对文本在聚类中的价值重新评定,使其对邮件文本进行了较好的分类。经实际验证,改进后的KNN个性化过滤方法能较好地实现对邮件进行个性化分类。
|