%0 Journal Article %T 基于离散序列报文的协议格式特征自动提取算法 %A 张霞 %A 李青 %J 计算机应用 %D 2017 %R 10.11772/j.issn.1001-9081.2017.04.0954 %X 摘要 针对缺少会话信息的离散序列报文,提出一种基于离散序列报文的协议格式(SPMbFSC)特征自动提取算法。SPMbFSC在对离散序列报文进行聚类的基础上,通过改进的频繁模式挖掘算法提取出协议关键字,进一步对协议关键字进行选择,筛选出协议格式特征。仿真结果表明,SPMbFSC在以单个报文为颗粒度的识别中对FTP、HTTP等六种协议的识别率均能达到95%以上,在以会话为颗粒度的识别中识别率可达90%。同等实验条件下性能优于自适应特征(AdapSig)提取方法。实验结果表明SPMbFSC不依赖会话数据的完整性,更符合实际应用中由于接收条件限制导致会话信息不完整的情形 %K 离散序列报文 %K 协议关键字提取 %K 自适应特征挖掘 %K 格式特征 %K 协议识别 %U http://www.joca.cn/CN/abstract/abstract20404.shtml