%0 Journal Article %T 基于半监督DPMM的新闻话题检测 News Topic Detection Based on Semi-supervised DPMM %A 姚冬冬 %A 袁方 %A 王煜 %A 刘宇 %J 郑州大学学报(理学版) %D 2016 %X 基于狄利克雷过程混合模型(DPMM)这一非参数贝叶斯生成模型,从语义的角度入手,结合其自动确定聚类个数的特性进行话题检测,运用了聚类个数K值由大到小变化的采样策略,通过逐层递进的形式获取到较为准确的K值,并在此基础上对语义聚类的词频特性加以分析,引入一组名词实体作为"热点特征词"来引导聚类过程,从而给出了DPMM半监督模型.实验结果表明,所给出的话题检测方法在TDT4语料上取得了较好的检测性能. %K 话题检测 %K 狄利克雷过程 %K Gibbs采样 %K 幂律特性 %K 名词实体 %U http://zzdz.cbpt.cnki.net/WKD/WebPublication/paperDigest.aspx?paperID=dfb8c2b3-9ba0-498f-a0b4-1b107c406da0