全部 标题 作者 关键词 摘要
Keywords: MEDL模型,HTML表格,XML,信息提取
Full-Text Cite this paper Add to My Lib
基于MEDL模型提出了一种以内容为导向的,将HTML转换为XML数据的方法。在该方法中,根据网页中值域和属性域的识别,并结合MEDL模型对HTML中的数据进行提取,并将其转换为符合要求的格式。该方法具有提取信息精确、转换格式统一等优点,且具备很好的扩展性,能够为深入开展Web数据挖掘提供很好的支持。
Full-Text
Contact Us
service@oalib.com
QQ:3279437679
WhatsApp +8615387084133