%0 Journal Article %T 统计流形扩散核的文本分类方法 %A 李侃 %A 周世斌 %A 刘玉树 %J 模式识别与人工智能 %P 339-345 %D 2012 %X 提出Dirichlet混合多项式(DCM)流形,并利用DCM流形可与正半球流形建立同胚和等距关系的性质,通过拉回映射将正半球流形的测地距离映射为DCM流形的测地距离,从而在DCM流形上建立距离度量,构建统计流形上的Dirichlet混合多项式扩散核和Dirichlet混合多项式倒排文档频率(DCMIDF)扩散核。利用WebKBTop4和20Newsgroups语料库上进行实验,DCM流形能比欧氏空间更能准确地描述文本。与多项式核支持向量机算法、,负测地距离核支持向量机算法相比,实验结果显示文中基于DCM扩散核和DCMIDF扩散核的支持向量机算法可取得良好的文本分类效果。 %K 统计流形 %K 扩散核 %K Dirichlet分布 %K 文本分类 %U http://manu12.magtech.com.cn/Jweb_prai/CN/abstract/abstract9428.shtml