|
计算机科学 2014
基于relative-idf的医药数据相似度算法研究Keywords: 医药数据相似度,编辑距离,relative-idf,tf-idf中图法分类号tp311.1文献标识码a Abstract: 医药数据相似度计算在药物信息处理中具有重要的作用。传统的文本相似度计算在医药领域并不能取得很好的效果。针对医药数据文本的特殊性,提出基于relative-idf的医药数据相似度计算算法。实验结果表明:相比传统tf-idf、编辑距离等计算方法,基于relative-idf的医药数据相似度计算在效率和准确性上都有了很大的提升。
|