全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于频繁词集聚类的微博新话题快速发现

, PP. 276-282

Keywords: 频繁词集聚类算法,微博,新话题,hadoop,mapreduce

Full-Text   Cite this paper   Add to My Lib

Abstract:

?新话题发现是进行舆情分析的基础和前提,新话题发现的一个关键环节是进行关键词的聚类分析.目前,大量的新话题来源于微博,但是将传统的聚类算法用于微博新话题发现时,会产生特征向量的高维性和稀疏性问题,使得聚类结果非常不准确,而且收敛时间难以控制,进而影响舆情分析的可靠性和实时性.鉴此,本文提出了频繁词集聚类fwsc(frequentwordssetsclustering)方法.实验结果表明,我们提出的方法能够快速有效地发现新话题.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133