%0 Journal Article %T 以本体为指导的Web网页信息抽取方法 %A 程文涛 %A 师雪霖* %J 北京化工大学学报(自然科学版) %D 2011 %X 针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。 %U http://www.journal.buct.edu.cn/CN/abstract/abstract14649.shtml