面向校园网的ip地址逐步优化层次聚类算法
Keywords: ip地址聚类,最近邻规则,最长前缀匹配,逐步优化的层次聚类
Abstract:
?对校园网主干数据流中ip地址进行聚类,可以得到网络用户访问地址的分布概况从而了解用户行为特征。已有聚类算法大都将ip地址作为普通数字考虑,忽略了其特征属性以致聚类结果不合理。为此提出一种改进算法:首先基于最长前缀匹配和改进的最近邻规则算法得到初始聚类,然后运用逐步优化层次聚类的思想进一步聚合最靠近子类,最终得到基于ip地址特征属性的聚类。实验结果表明该算法与以往算法相比,提高了聚类效果,具有较好的准确性和可行性。
Full-Text