%0 Journal Article
%T 基于MEDL模型的HTML向XML的转换方法
%A 杜茂康
%A 李韶华
%A 刘苗
%J 重庆邮电大学学报(自然科学版)
%D 2012
%X 基于MEDL模型提出了一种以内容为导向的,将HTML转换为XML数据的方法。在该方法中,根据网页中值域和属性域的识别,并结合MEDL模型对HTML中的数据进行提取,并将其转换为符合要求的格式。该方法具有提取信息精确、转换格式统一等优点,且具备很好的扩展性,能够为深入开展Web数据挖掘提供很好的支持。
%K MEDL模型
%K HTML表格
%K XML
%K 信息提取
%U http://journal.cqupt.edu.cn/jcuptnse/jcuptnse/ch/reader/view_abstract.aspx?file_no=20120623&flag=1