|
计算机科学 2005
基于最大熵原理的汉语词义消歧Keywords: 词义消歧最大熵原理汉语自然语言处理机器学习方法最大熵模型关键问题知识表示特征上下文规范化多义词正确率 Abstract: 词义消歧是自然语言处理中亟待解决的一个关键问题,本文提出一种基于最大熵模型的有监督的机器学习方法,用于汉语词义消歧。该方法综合了词标记、词性、主题等上下文特征,并用一种统一的表示方法规范化特征形式,解决了多种不同特征之间的融合和特征的知识表示。实验对20个汉语高频多义词进行了测试,平均正确率为87%,验证了该方法的有效性。
|