%0 Journal Article %T 基于MEDL模型的HTML向XML的转换方法 %A 杜茂康 %A 李韶华 %A 刘苗 %J 重庆邮电大学学报(自然科学版) %D 2012 %X 基于MEDL模型提出了一种以内容为导向的,将HTML转换为XML数据的方法。在该方法中,根据网页中值域和属性域的识别,并结合MEDL模型对HTML中的数据进行提取,并将其转换为符合要求的格式。该方法具有提取信息精确、转换格式统一等优点,且具备很好的扩展性,能够为深入开展Web数据挖掘提供很好的支持。 %K MEDL模型 %K HTML表格 %K XML %K 信息提取 %U http://journal.cqupt.edu.cn/jcuptnse/jcuptnse/ch/reader/view_abstract.aspx?file_no=20120623&flag=1