|
中山大学学报(自然科学版) 2017
考虑KL散度的多源软件缺陷预测方法Keywords: 相似性,KL散度,多源,迁移学习,软件缺陷预测 Abstract: 摘要&p;现有基于多源迁移学习的软件缺陷预测方法解决了跨项目软件缺陷预测的难题.其通过多个源项目分别对目标项目进行预测,并进行加权得出预测结果,然而其权值的设置仅取决于对目标项目中训练数据预测结果的准确程度,忽视了源项目与目标项目之间的差异性.针对源项目与目标项目之间可能存在的分布差异特性,提出使用KL散度进行度量的方法,在设置不同源项目权重时,同时考虑预测结果的准确程度以及该项目与目标项目的相似性特征,以此作为迁移依据建立多源迁移的预测模型.基于NASA的4个数据集实验结果表明,对比现有多源迁移学习的软件缺陷预测方法,该方法的AUC与F值平均提高0.045与0.035,在一定程度上提高了软件缺陷预测的性能
|