|
计算机科学 2013
一种基于双数组trie的b2b规则串提取方法Keywords: 双数组trie,垂直搜索,规则串,b2b系统 Abstract: 针对b2b垂直搜索引擎中提取产品规格信息困难的问题,提出了一种基于双数组trie(double-arraytrie)的规则串提取方法。该方法针对b2b系统中“参数名:参数值”字符串的规则特征构建规则串,生成双数组trie树;并优先处理分支结点最多的子树,来提高存储效率。该方法对搜索文本进行一次扫描就能得到所有规则串;通过在规则中加入约束条件,对候选串进行有效过滤,以提高规则串的提取准确率。实验表明,该方法能够降低传统规则串查找的算法复杂度,查找规则串的时间复杂度是o(n)。
|