全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2002 

基于bayes潜在语义模型的半监督web挖掘

, PP. 1508-1514

Keywords: 贝叶斯潜在语义分析,半监督学习,简单贝叶斯分类,期望最大化算法,web挖掘

Full-Text   Cite this paper   Add to My Lib

Abstract:

随着互联网信息的增长,web挖掘已经成为数据挖掘研究的热点之一.网页分类是通过学习大量的带有类别标注的训练样本来预测网页的类别,人工标注这些训练样本是相当繁琐的.网页聚类通过一定的相似性度量,将相关网页归并到一类.然而传统的聚类算法对解空间的搜索带有盲目性和缺乏语义特征.提出了两阶段的半监督文本学习策略.第1阶段,利用贝叶斯潜在语义模型来标注含有潜在类别主题词变量的网页的类别;第2阶段,利用简单贝叶斯模型,在第1阶段类别标注的基础上,通过em(expectationmaximization)算法对不含有潜在类别主题词变量的文档作类别标注.实验结果表明,该算法具有很高的精度和召回率.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133