|
现代图书情报技术 2013
基于有效词频的改进c-value自动术语抽取方法Keywords: 自动术语抽取,ec-value,有效词频,术语簇,带权复杂图模型的专利关键词标引研究 Abstract: ?现有的中文术语自动抽取方法主要针对术语的高频特征与单元性指标,而低频术语和术语的术语性指标缺乏有效的处理方法。针对上述问题,将背景语料库引入c-value方法,提出词语领域分布度与有效词频的概念,通过计算候选术语的ec-value值来自动抽取术语,并结合术语簇识别与挖掘,改善低频术语抽取性能。通过计算机领域术语抽取实验,表明本文提出的改进方法(ec-value方法)能更有效地衡量术语的术语性,改善低频术语抽取性能。
|