|
中国中药杂志 2011
正则表达式在上市中药文献信息提取中的应用Keywords: 中药上市后再评价,文献分析,正则表达式,信息提取 Abstract: 上市中药文献分析任务繁重,利用计算机自动提取目标信息之后再进行人工检查,可以简化工作、提高效率。该文分析了上市中药文献信息提取的难点,认为非术语信息的匹配和不同分组的同类信息的区分是影响常用信息提取技术在上市中药文献信息提取中应用的两大关键问题。该文分析了正则表达式的模式匹配对于解决上述两大问题的价值,并选取"病例数"(非术语信息)和"有效率"(不同分组同类信息区分)2种信息,以此为例探讨了基于正则表达式的信息提取方法,初步实践了这一思路。
|