|
计算机科学 2014
基于latex的web数学公式提取方法研究DOI: 10.11896/j.issn.1002-137X.2014.06.029 Keywords: 数学公式,latex,查准率,查全率,主题爬虫,搜索引擎中图法分类号tp311文献标识码a Abstract: 数学论坛、wiki等社会性网站对数学教育的影响日益增长,数学公式广泛存在这些网站中,如何对这些网站中的数学公式进行搜索,对学习和科研非常重要。数学公式提取是索引系统的前提和基础,文中主要研究latex格式的数学公式的提取方法,结合bnf表述方式,提出自动分析提取包含latex公式特征的方法。依据公式包含的特征,提出提取和过滤latex数学公式的方法规则。通过实验发现,该方法的查全率达到75%,查准率达到99%。
|