|
- 2018
基于 M3 和 POSS 特征的网络流量分类研究DOI: 10.3969/ j. issn.1673-629X.2018.01.018 Keywords: 网络流量分类, 类别不平衡, 多目标演化子集选择算法, 最小最大模块化 Abstract: 网络流量分类是网络研究和流量工程的重要基础,网络流量分类大致分为基于端口号、有效负载、主机行为和机器学 习等四种分类方法。 目前基于机器学习的方法成为了研究热点。 在机器学习过程中,特征选择可以实现数据维度约简,从而提高学习模型的泛化能力。 针对大规模的流量数据以及网络流量中存在的类别不平衡问题,将最小最大集成策略(min-max module,M3)和多目标演化子集选择算法(Pareto optimization for subset selection,POSS)应用到网络流量分类的特征选择过程中。 同时将该方法与其他特征选择方法以及经典的处理类别不平衡问题的方法进行对比。 实验结果表明,M3 策略在大部分情况下能获得较好的性能,并能有效处理网络流量中类别不平衡的问题,在流量分类应用中具有一定的实用性
|