%0 Journal Article %T 古籍文本抽词研究 %A 曹艳 %A 侯汉清 %J 图书情报工作 %D 2008 %X ?目前古籍文本检索大多局限于篇、章及目录,即使是全文检索一般也是基于单汉字的检索,由于没有现成的古籍词表可用,古籍文本的标引和检索效率都受到影响。现将处理现代文本的n元组法移植到古籍文本中进行实义词提取,实验步骤包括:自动分词并统计词频;利用抽词词典和停用词词典得到候选词汇;通过简单计算对n元组进行剔除过滤;人工判别提取实词。实验共从10万字的文本对象《齐民要术》中提取古籍普通语词和专有名词(包括书名、地名、人名官职名)共3369个,表明此实验方案基本是可行的。 %K 实义词 %K 实义词 %K 古籍数字化 %K 古籍数字化 %K n-gram %K n-gram %K 自动分词 %K 自动分词 %U http://124.16.154.130:8080/lis/CN/abstract/abstract8649.shtml