%0 Journal Article %T 基于闭合频繁Induced子树的GML文档结构聚类 %A 苗建新 %A 吉根林 %A 朱颖雯 %J 南京师范大学学报(工程技术版) %P 61-64 %D 2009 %X 提出了一种GML文档结构聚类新算法MCF-CLU.与其它相关算法不同,该算法基于闭合频繁Induced子树进行聚类,聚类过程中不需树之间的两两相似度比较,而是挖掘GML文档数据库的闭合频繁Induced子树,为每个文档求一个闭合频繁Induced子树作为该文档的代表树,将具有相同代表树的文档聚为一类.聚类过程中自动生成簇的个数,为每个簇形成聚类描述,而且能够发现孤立点.实验结果表明算法MCF-CLU是有效的,且性能优于其它同类算法. %K 闭合频繁Induced子树 %K GML结构聚类 %K 聚类 %U http://njsfdxgckj.paperonce.org/oa/DArticle.aspx?type=view&id=200902013