|
软件学报 2012
基于词语距离的网络图词义消歧DOI: 10.3724/SP.J.1001.2012.04116, PP. 776-785 Keywords: 词语距离,马尔可夫链,网络图模型,pagerank,参数估计 Abstract: 传统的基于知识库的词义消歧方法,以一定窗口大小下的词语作为背景,对歧义词词义进行推断.该窗口大小下的所有词语无论距离远近,都对歧义词的词义具有相同的影响,使词义消歧效果不佳.针对此问题,提出了一种基于词语距离的网络图词义消歧模型.该模型在传统的网络图词义消歧模型的基础上,充分考虑了词语距离对消歧效果的影响.通过模型重构、优化改进、参数估计以及评测比较,论证了该模型的特点:距离歧义词较近的词语,会对其词义有较强的推荐作用;而距离较远的词,会对其词义有较弱的推荐作用.实验结果表明,该模型可以有效提高中文词义消歧性能,与semeval-2007:task#5最好的成绩相比,该方法在macroave(macro-averageaccuracy)上提高了3.1%.
|