基于数据挖掘的中国科技论文在线首发论文下载次数典型特征研究
Keywords: 中国科技论文在线,首发论文,数据挖掘,回归树,下载次数,典型特征
Abstract:
?通过属性规约、空缺值处理及异常值检测,对中国科技论文在线2003-2009年37898篇首发论文数据进行数据预处理。对数据预处理后的37348篇首发论文,构建下载次数的回归树模型,通过模型结果分析,得出下载次数的影响因素依次为首发论文的发表时间、所属学科以及首发论文的星级评定结果,并分析下载次数在这三个方面的典型特征。
Full-Text