|
计算机应用 2012
web文本中维吾尔语领域术语的自动发现Keywords: 维吾尔语,互信息,条件随机场,tf/idf Abstract: ?针对维吾尔语领域术语获取难度大,人工扩充领域术语工作量大、效率低等特点,利用词汇共现原理,以维吾尔语连接词和互信息(mi)为工具,快速扩充原始维吾尔语领域术语;建立了以维吾尔语领域术语为特征模板,利用条件随机场(crf)模型实现web文本中维吾尔语领域术语的自动发现方法,并在此基础上实现长维吾尔语领域术语的自动发现。实验表明,对短维吾尔语领域术语的自动发现准确率为97.59%,召回率为93.38%,对长维吾尔语领域术语的自动发现正确率达到55.72%。
|