全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于lsi和自组织神经网络的高效文本聚类方法

, PP. 1026-1030

Keywords: 文本聚类,隐含语义索引,奇异值分解,自组织神经网络,向量空间模型

Full-Text   Cite this paper   Add to My Lib

Abstract:

根据隐含语义索引(lsi)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的文本特征向量来说,聚类速度很低;该方法应用lsi理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间的语义关系.通过奇异值分解(svd),有效地降低了向量空间的维数,克服了自组织神经网络的聚类缺陷,提高了文本聚类的精度和速度。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133