%0 Journal Article %T Web网页知识获取技术 %A 胡思康 %A 曹元大 %J 北京理工大学学报 %D 2006 %X 描述一种基于类自然语言理解的Web文本知识自动获取技术.用领域文法描述Web网页文本,将该领域文法转换成描述句子信息的、符合正则表达式规范的规则,使用该规则把Web网页文本转换为表示网页知识的语义三元组,最后形成领域知识库.试验数据表明,通过本技术生成的领域知识库中不同类型网页数据的召回率平均值是71.5%,准确率平均值是79.1%. %K 类自然语言理解 %K Web网页文法 %K 语义三元组 %U http://journal.bit.edu.cn/zr/ch/reader/view_abstract.aspx?file_no=20061208&flag=1