%0 Journal Article %T 基于分块重要度和二维条件随机场的web信息抽取 %A 吴秦 %A 胡丽娟 %A 梁久祯* %J 南京大学学报(自然科学) %D 2014 %R DOI:10.13232/j.cnki.jnju.2014.01.012 %X 网页分块方法使得web信息抽取的单位由原来的页面缩小为分块。结合分块重要度模型与二维条件随机场的优点,提出一种web对象信息抽取方法。该方法利用分块重要度模型对网页分块进行重要度标注,过滤掉大量与主题无关信息,更加准确的定位待抽取信息的位置。二维条件随机场模型相比传统的线性条件随机场模型更好的适应了网页分块的二维结构,有效的提高信息抽取准确率。实验结果表明,该方法对web对象信息抽取具有良好的效果。 %K web对象 %K 信息抽取 %K 网页分块 %K 分块重要度模型 %K 二维条件随机场 %U http://jns.nju.edu.cn/oa/DArticle.aspx?type=view&id=2014010022