|
现代图书情报技术 2014
改进tfidf算法在潜在合作关系挖掘中的应用研究Keywords: 改进tfidf算法,潜在合作关系,数据挖掘,耦合分析 Abstract: ?[目的]弥补传统方法在潜在合作关系挖掘中的缺陷和不足,提高潜在合作关系的挖掘效果。[方法]在分析简单计算法、最小值计算法与传统tfidf算法缺陷和不足的基础上,提出改进tfidf算法,并将其引入到潜在合作关系挖掘中。[结果]利用《北大中文期刊核心目录(2012年版)》中19种图书情报类期刊近5年情报学研究方法应用领域的论文作为样本数据,发现简单计算法与最小值计算法受到作者发文量影响较大,传统tfidf算法的挖掘结果很难实现从潜在合作关系转化为现实合作关系,而改进tfidf算法对此的满足度则表现得非常突出。[局限]改进tfidf算法未考虑论文中作者之间的排名顺序对潜在合作关系的影响。[结论]通过将4种挖掘结果进行对比和评价,证明改进tfidf算法较其他传统方法更科学、更具有优越性和实用价值。
|