%0 Journal Article %T 邮件网络协同过滤机制研究 %A 杨震 %A 赖英旭 %A 段立娟 %A 李玉鑑 %A 许昕 %J 自动化学报 %P 399-411 %D 2012 %R 10.3724/SP.J.1004.2012.00399 %X ?基于Enron邮件集合探索真实邮件网络,揭示出邮件网络的无标度特性和有限小世界特性.在此基础上,依据用户间交互强度设计出垃圾邮件协同过滤机制,通过调整参数λ,用户可以决定主要是依靠自己还是其他用户协同进行垃圾信息过滤.算法即使在没有对用户个人阅读习惯充分训练的情况下,也可以通过基于交互强度的网络协同方式实现良好过滤.同时为了解决Enron数据集缺乏标注的情况,基于训练样本集W和测试样本集T独立同分布的假设,利用改进的EM(Expectationmaximization)算法最小化W∪T集合上风险函数,给出了未知样本的一个良好标注.真实数据上的实验表明,同单机过滤和集成过滤方法相比,协同过滤能够提高平均过滤精度且方法简单易行. %K 文本分类 %K 邮件过滤 %K 邮件网络 %K 协同过滤 %U http://www.aas.net.cn/CN/abstract/abstract17690.shtml