%0 Journal Article %T 从web文档中构造半结构化信息的抽取器 %A 黄豫清? %A 戚广志? %A 张福炎? %J 软件学报 %P 73-78 %D 2000 %X 为了对web上不规则的、动态的信息按照数据库的方式集成和查询,采用对象交换模型(objectexchangemodel,简称oem)建立了web信息模型.为了将页面中各个部分表示为对应的oem对象,设计了半结构化信息的抽取算法,并给出测试结果.该方法可以抽取结构化和半结构化的信息,比现有的抽取方法通用性更强. %K 启发式规则 %K 数据抽取格式 %K 对象交换模型. %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=20000109&flag=1