|
计算机应用 2012
基于lda主题模型的标签传递算法Keywords: lda主题模型,标签传递算法,半监督学习,数据降维,流行假设 Abstract: ?标签传递算法是一种半监督分类方法,由于该算法存在要求数据分类结果符合流行假设、数据维数较高时计算复杂度高等问题,在文本分类中效果较差。针对这些问题,经过对lda主题模型和标签传递算法原理及复杂度的分析,将两者结合,提出一种基于lda主题模型的标签传递算法lplda。该算法用lda主题模型中的主题表示文本数据,一方面使用lda主题模型表示文本保证分类结果符合流行假设,另一方面有效减少标签传递算法相似度计算时间。经过实验证明,该算法在标记数据少于待测样本时,分类效果优于传统的有监督分类方法。
|