|
计算机科学 2014
一种解决“中心主题湮没问题”的基于图模型的labeled-lda文本分类算法Keywords: 文本分类,图挖掘,图模型,隐含狄利克雷分配中图法分类号tp391.1文献标识码a Abstract: 隐含狄利克雷分配(lda,latentdirichletallocation)是一种用于挖掘文档集中潜在主题信息的无监督主题模型。而lda模型的变形labeled-lda则可以作为有监督的多标签分类器,它建立了主题与标签的一一映射,从而学习出词与标签之间的关系。近年来,图模型在文本挖掘方面的应用取得了良好的效果,通过对文档建立图模型,为进一步分析文档的语义提供了新的途径。提出了一种利用labeled-lda和文档图模型进行文本分类的新算法,与传统的lda模型方法相比,该方法的性能有较大的提高。
|