|
软件学报 2009
利用语义词典web挖掘语言模型的无指导译文消歧, PP. 1292-1300 Keywords: 词义消歧,无指导译文消歧,语言模型,web挖掘,知识获取 Abstract: 为了解决困扰词义及译文消歧的数据稀疏及知识获取问题,提出一种基于web利用n-gram统计语言模型进行消歧的方法.在提出词汇语义与其n-gram语言模型存在对应关系假设的基础上,首先利用hownet建立中文歧义词的英文译文与知网def的对应关系并得到该def下的词汇集合,然后通过搜索引擎在web上搜索,并以此计算不同def中词汇n-gram出现的概率,然后进行消歧决策.在国际语义评测semeval-2007中的multilingualchineseenglishlexicalsampletask测试集上的测试表明,该方法的pmar值为55.9%,比其上该任务参评最好的无指导系统性能高出12.8%.
|