|
中山大学学报(自然科学版) 2015
基于《知网》2008的词语相似度计算Abstract: 摘要 《知网》是一部比较详尽的语义知识词典,含有丰富的语义信息和世界知识,研究其特定的语言描述方法是科学合理利用《知网》的关键.《知网》的知识系统描述语言方式也在不断改进和改善,已经从过去的线性方式发展为现在的立体、可嵌套的方式.因此,本文对《知网》2008版本所使用的描述方式进行介绍,并基于此描述方式实现了两种词语相似度计算方法.其中,方法一的设计思想源于《知网》2000版本的计算方法;方法二是对现有《知网》2008版本的计算方法进行了适当改进.实验结果表明,与现有《知网》2008版本的词语相似度计算方法进行比较,运用本文所实现两种方法,一些词语的相似度计算结果更为合理,从而更加符合人们的主观判断
|