%0 Journal Article %T 一种基于UCL的中文网页信息过滤方法 %A 邢玲 %A 马建国 %A 李幼平 %A 刘志文 %J 电子学报 %P 1752-1757 %D 2006 %X 围绕如何在浩瀚的中文网页中找到用户感兴趣的内容,提出了基于UCL(UniformContentLocator)的"二阶过滤法".它将媒体空间中的信息用UCL语义格(SemanticCasesbasedonUCL,SCU)表示,通过语义向量空间模型(SemanticVectorSpaceModel,SVSM)对网页的语义矩阵进行分析计算,粗略筛选出用户感兴趣的网页;再借助精细语义逐句解读其内容,提取用户所关注的信息.根据用户的阅读行为动态了解用户的兴趣变化,建立用户兴趣的本体模型,并分析和定义了用户兴趣度的度量.实验验证了上述过滤方法的有效性,其测试结果同向量空间模型(VectorSpaceModel,VSM)进行了比较,性能明显优于VSM. %K UCL %K 信息过滤 %K UCL语义格 %K 语义向量空间 %K 兴趣本体模型 %U http://www.ejournal.org.cn/CN/abstract/abstract1497.shtml