全部 标题 作者 关键词 摘要
Keywords: dom,文本分割,主题边界,文本节点
Full-Text Cite this paper Add to My Lib
?利用web文档的半结构化信息,提出一种基于dom的web文本分割算法。该算法充分挖掘web网页中控制网页内容结构和显示的html标签信息,构建htmldom树。首先通过改进传统的平面文本分割方法,使之适用于web文本分割;然后利用dom树中的节点平滑平面文本分割的结果,初步实验表明该算法能有效提高web文本分割的精确度。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133