|
计算机科学 2011
lda模型在话题追踪中的应用Abstract: 随着对lda模型的研究越来越深入,文本表示和挖掘能力进一步提高。“话题”是lda模型中一个非常重要的概念,是特征集合的一个多项式概率分布。话题追踪是根据少数已知相关信息在未知报道流中追踪一个话题,找出与该话题相关的所有报道。把lda模型用于话题追踪,目的有两个:(一)检验ld八话题对追踪话题的表示能力;(二)检验lda模型在挖掘训练数据中的追踪话题时,lda话题和追踪话题之间的关系。实验表明:相对于经典的向量空间模型和一元语言模型,以及专门针对追踪话题提出的事件模型,基于lda模型的追踪性能更好,但由于粒度不同,lda模型中的话题和追踪话题并没有直接的一一对应的关系,实现可定制话题的lda模型是下一步工作的目标。
|