%0 Journal Article %T 基于本体和dom相结合的web信息抽取器 %A 柳佳刚 %A 陈山 %A 贺令亚 %J 现代图书情报技术 %D 2009 %X ?针对基于web页面信息本体的信息抽取不能准确划定抽取区域的缺点,设计基于本体和dom相结合的web信息抽取器。利用dom树设计对样本页面信息项路径进行归纳学习的算法,该算法能准确划定信息抽取区域,降低页面噪声,实现对web页面的预处理。实验表明,改进后的抽取方法提高了web信息的抽准率。 %K 信息抽取 %K 包装器 %K 本体 %K 文档对象模型 %K 归纳学习 %U http://www.infotech.ac.cn/CN/abstract/abstract764.shtml