|
图书情报工作 2009
基于互信息的二阶共现概念相关度研究Keywords: 互信息,二阶共现,相关度,2型糖尿病,基于非相关文献的知识发现,共现关键词—叙词同义关系自动识别研究——基于互信息法、概率法的对比分析 Abstract: ?中间集和目标集的膨胀,导致基于非相关文献知识发现的准确率低;基于排序的方法存在缺陷,且过度关注b集的排序是对发现有趣的a、c的偏离。直接计算二阶共现概念相关度是基于非相关文献知识发现的薄弱环节,以互信息方法和回归分析方法为基础,构造算法计算二阶共现概念之间的相关度。以pubmed收录的2型糖尿病领域文献为样本,对算法的可行性进行实证研究。模型取得较好的效果,为二阶共现概念之间的关系提取和评价提供新的方法。
|