%0 Journal Article %T 一组相关XML数据文件的数据类识别方法 %A 李赛男 %A 余金山 %J 华侨大学学报(自然科学版) %P 387-391 %D 2014 %R 10.11830/ISSN.1000-5013.2014.04.0387 %X 为解决当前可扩展标记语言(XML)绑定框架普遍存在的由XML模式映射生成的数据类的冗余,以及数据类系统规模过大的问题,提出一种从一组相关XML数据文件的数据实体类识别方法.该方法先抽取这一组XML数据文件的XML模式树图,并将其每个节点表示成向量空间中的向量;然后,利用相似度和距离识别该模式节点对应的预定义模式节点类型;最后,按模式节点类型到类的映射规则得到数据类.结果表明:该方法能识别合并对应同一个实体的数据类避免类冗余,将集合类型的XML文件映射成泛型类和集合类减小生成类系统的规模. %K 类识别 %K 可扩展标记语言 %K 数据绑定 %K 模式树图 %K 节点类型 %K 相似度 %U http://www.hdxb.hqu.edu.cn/oa/DArticle.aspx?type=view&id=201404006