%0 Journal Article %T 基于改进向量空间模型的克隆群映射方法 %A 张丽萍 %A 张久杰 %A 王春晖 %A 王欢 %J 计算机应用 %D 2016 %R 10.11772/j.issn.1001-9081.2016.07.2031 %X 摘要 针对Type-3克隆代码映射方法少且效率低等问题,提出了一种基于改进向量空间模型(VSM)的映射方法。该方法将改进的VSM引入到克隆代码分析中,从而得到一种可有效映射Type-1、Type-2以及Type-3克隆代码的克隆群映射方法。首先,将克隆群文档预处理得到去除无用词的代码文档,同时提取克隆群文档的文件名、函数名等特征项;其次,提取并构建克隆群词频向量空间,利用余弦算法计算出克隆群相似度;然后,通过克隆群相似度和特征项的匹配构建克隆群映射,最终得到克隆群映射结果。对5款开源软件进行实验并人工验证,所提方法能在低时耗的前提下,保证查全率和查准率均不低于96.1%和97.1%。实验结果表明了所提方法的可行性,为后期软件演化分析提供数据支撑 %K 克隆代码 %K 克隆群映射 %K 向量空间模型 %K 特征项 %K 词频 %U http://www.joca.cn/CN/abstract/abstract19594.shtml