%0 Journal Article
%T Thematic VSM Based on Ontology Semantic Tree
基于本体语义树的主题空间向量模型
%A LU Cheng-Shan
%A
卢承山
%J 计算机系统应用
%D 2011
%I
%X 在传统检索模型的基础上,结合本体的概念,提出一种基于本体语义树的主题空间向量模型。该模型能够用语义概念树描述一个主题,与传统基于关键词描述主题的方法不同,它能够描述概念之间的简单语义关系。在此基础上,给出HTML页面内容与主题相关度的计算方法。在分析URL的相关度时,不仅分析链接锚文本与主题相关度,还结合了改进的PageRank算法来分析链接的相关度。只有当链接相关度达不到给定的阀值时才会去下载链接对应的页面。这样的URL相关度计算方法可以大大减少不必要的计算开销,又可以充分地利用锚文本和链接重要度信息。最后还对那些不确定是否与主题相关的网页进行内容相关度计算,进而最终确定是否应该采集此网页。
%K ontology
%K semantic tree
%K thematic network
%K anchor text
%K degree subject
本体
%K 概念树
%K 主题网络
%K 锚文本
%K 主题相关度
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=D4F6864C950C88FFCE5B6C948A639E39&aid=48687FEEF97E58611AF309F99E1FA4E1&yid=9377ED8094509821&vid=A04140E723CB732E&iid=F3090AE9B60B7ED1&sid=1AE5323881A5ECDC&eid=B6DA1AC076E37400&journal_id=1003-3254&journal_name=计算机系统应用&referenced_num=0&reference_num=11