|
华侨大学学报(自然科学版) 2016
计算机文本信息挖掘技术在网络安全中的应用DOI: 10.11830/ISSN.1000-5013.2016.01.0067 Keywords: 文本信息, 文本挖掘, 文本分类, 邻近分类 Abstract: 针对网络文本信息的安全性判别问题,采取改进的邻近分类算法挖掘文本.该改进邻近分类方法在传统方法定义分类特征的同时,起用共线性判别矩阵,对具有共线属性的特征合并处理.这种改进策略,不仅可以增加分类特征的准确性,也可以加快文本信息的分类进程.对Spambase语料库开展实验研究,从精度、召回率、联判度、误差4个维度对分类效果进行评价.结果显示:改进的邻近分类方法具有明显的优势,可以更加准确地区分安全文本和危险文本.
|