%0 Journal Article %T 一种基于语料特性的聚类算法 %A 曾依灵? %A 许洪波? %A 吴高巍? %A 白硕? %J 软件学报 %P 2802-2813 %D 2010 %X 为寻求模型不匹配问题的一种恰当的解决途径,提出了基于语料分布特性的cadic(clusteringalgorithmbasedonthedistributionsofintrinsicclusters)聚类算法。cadic以重标度的形式隐式地将语料特性融入算法框架,从而使算法模型具备更灵活的适应能力。在聚类过程中,cadic选择一组具有良好区分度的方向构建cadic坐标系,在该坐标系下统计固有簇的分布特性,以构造各个坐标轴的重标度函数,并以重标度的形式对语料分布进行隐式的归一化,从而提高聚 %K cadic(clustering %K algorithm %K based %K on %K the %K distributions %K of %K intrinsic %K clusters) %K 文本聚类 %K 模型不匹配 %K 重标度 %K 信息检索 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=3677&flag=1