%0 Journal Article %T 基于遗传算法和隐马尔可夫模型的web信息抽取的改进 %A 李荣 %A 胡志军 %A 郑家恒? %J 计算机科学 %D 2012 %X 为了进一步提高web信息抽取的准确性和效率,针对web信息抽取的遗传算法和一阶隐马尔可夫模型混合方法在初值选取和参数寻优上的不足,提出了一种遗传算法和二阶隐马尔可夫模型内嵌结合的改进方法。在分层预处理阶段,利用格式信息和文本特征将文本切分成文本行、块或单个的词等恰当的层次;然后采用内嵌的遗传算法和二阶隐马尔可夫混合模型训练参数,保留最优和次优染色体,修正13aum-wclch算法的初始参数,多次使用遗传算法微调二阶隐马尔可夫模型;最后用改进的vitcrbi算法实现wcb信息抽取。实验结果表明,改进方法在精确度、召回率指标和时间性能上均比遗传算法和一阶隐马尔可夫模型的混合方法具有更好的性能。 %K web信息抽取 %K 遗传算法 %K 二阶隐马尔可夫模型 %K 分层 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=120344&flag=1