全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...
软件学报  2005 

基于改进决策树算法的网络关键资源页面判定

, PP. 1958-1966

Keywords: 网络信息检索,关键资源页面,机器学习,决策树

Full-Text   Cite this paper   Add to My Lib

Abstract:

关键资源页面是网络信息环境中一种重要的高质量页面,是用户进行网络信息检索的主要目标.决策树算法是机器学习中应用最广的归纳推理算法之一,适用于关键资源页面的判定.然而由于web数据均一采样的困难性,算法缺乏有足够代表性的反例进行训练.为了解决这个问题,提出一种利用训练样例的统计信息而非个体信息进行学习的改进决策树算法,并利用这种算法实现了独立用户查询的关键资源页面判定.在2003年文本信息检索会议(textretrievalconfefence,简称trec)标准的评测条件下,基于此种改进决策树算法的大规模网络信息检索实验获得了超过基本算法40%的性能提高.这不仅提供了一种查找web关键资源页面的有效方式,也给出了提高决策树算法性能的一个可行途径.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133