%0 Journal Article %T 考虑层数信息的XML文档聚类方法 %A 刘兆军 %A 赵浩宇 %A 王婧 %A 李雄飞 %A 李巍 %J 吉林大学学报(工学版) %P 124-128 %D 2014 %X 提出了一种层数敏感的XML文档数据集聚类方法CXLI。首先提出结构表概念,消除XML文档的重复和嵌套结构。然后提出考虑层数信息的XML文档基本编辑操作约束。进一步给出考虑层数信息的XML文档间相似性度量方法。最后使用凝聚型层次聚类方法对XML文档数据集进行聚类。在ACMSIGMOD数据集和人工生成的数据集上进行了实验验证,结果表明:在计算时间基本相同的情况下,CXLI方法具有更好的精确度。 %K 人工智能 %K 数据挖掘 %K 可扩展标记语言 %K 相似性度量 %K 聚类 %K 层数 %U http://xuebao.jlu.edu.cn/gxb/CN/Y2014/V44/I01/124