%0 Journal Article %T 一种中文微博新闻话题检测的方法 %A 郑斐然 苗夺谦 张志飞 高灿? %J 计算机科学 %D 2012 %X 微博的迅猛发展带来了另一种社会化的新闻媒体形式。提出一种从微博中挖掘新闻话题的方法,即在线检测微博消息中大量突现的关键字,并将它们进行聚类,从而找到新闻话题。为了提取出新闻主题词,综合考虑短文本中的词频和增长速度而构造复合权值,用以量化词语是新闻词汇的程度;在话题构造中使用了上下文的相关度模型来支撑增量式聚类算法,相比于语义相似度模型,其更能适应该问题的特点。在真实的微博数据上运行的实验表明,本方法可以有效地从大量消息中检测出新闻话题。 %K 微博 %K 新闻 %K 话题检测 %K 聚类 %U http://www.jsjkx.com/jsjkx/ch/reader/view_abstract.aspx?file_no=120131&flag=1