%0 Journal Article %T 基于互信息选择聚类集成的网络流量分类方法 %A 丁要军 %A 蔡皖东 %J 计算机应用 %D 2013 %X ?针对互联网流量标注困难以及单个聚类器的泛化能力较弱,提出一种基于互信息(mi)理论的选择聚类集成方法,以提高流量分类的精度。首先计算不同初始簇个数k的k均值聚类结果与训练集中流量协议的真实分布之间的规范化互信息(nmi);然后基于nmi的值来选择用于聚类集成的k均值基聚类器的k值序列;最后采用二次互信息(qmi)的一致函数生成一致聚类结果,并使用一种半监督方法对聚类簇进行标注。通过实验比较了聚类集成方法与单个聚类算法在4个不同测试集上总体分类精度。实验结果表明,聚类集成方法的流量分类总体精度能达到90%。所提方法将聚类集成模型应用到网络流量分类中,提高了流量分类的精度和在不同数据集上的分类稳定性。 %K 聚类集成 %K k均值 %K 流量分类 %K 互信息 %U http://www.joca.cn/CN/abstract/abstract16142.shtml