全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于dom的web文本分割

Keywords: dom,文本分割,主题边界,文本节点

Full-Text   Cite this paper   Add to My Lib

Abstract:

?利用web文档的半结构化信息,提出一种基于dom的web文本分割算法。该算法充分挖掘web网页中控制网页内容结构和显示的html标签信息,构建htmldom树。首先通过改进传统的平面文本分割方法,使之适用于web文本分割;然后利用dom树中的节点平滑平面文本分割的结果,初步实验表明该算法能有效提高web文本分割的精确度。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133