Automatic Domain-specific Term Extraction in Administrative-domain Ontology
政务领域本体术语的自动抽取*
Keywords: 政务领域本体,术语,单字合并法,C-value,TFIDF算法
Abstract:
提出一种新的政务本体术语自动抽取的方法。首先通过中文分词技术和单字合并法提取政务文本中的词作为候选术语;通过C-value求解法和TF-IDF算法对候选术语进行过滤抽取,从而实现政务领域术语的自动抽取。通过实验比较,发现该方法在不影响领域术语抽取召回率的同时可以提高抽取术语的正确率。
Full-Text