|
计算机科学 2013
基于潜在语义分析的deepweb查询接口聚类研究Keywords: 潜在语义分析,奇异值分解,deepweb,查询接口聚类 Abstract: 集成查询接口的生成是deepweb数据集成的重要组成环节。如何对不同领域的查询接口进行有效的聚类是生成集成查询接口时需要解决的核心问题之一。针对传统的向量空间模型在deepweb查询接口聚类时单纯依赖关键词匹配的缺点,引入潜在语义分析(lsa)的方法来发掘查询接口之间的语义关系,并给出了基于潜在语义分析的deepweb查询接口聚类算法,最后采用uiuc的web集成资源库提供的数据进行了实验。结果表明,潜在语义分析的方法提高了同一领域查询接口之间的相似度,明显改善了deepweb查询接口聚类的质量。
|