%0 Journal Article %T 基于web的专利双语语料自动获取研究及实现*——以esp@cenet数据库为例 %A 吴琳 %A 魏星 %A 霍翠婷 %J 现代图书情报技术 %D 2009 %X ?针对专利资源,研究一种有效地从专利数据库中获取高质量双语对译语料的方法。该方法利用网页的url命名特点获取专利数据的详细网页,以实现网页的批量下载,并通过网页解析,采用正则匹配表达式提取出网页上的所需信息,合并数据后形成双语对照的语料数据库。 %K 专利 %K 著录信息 %K 双语平行语料 %K 网页解析 %U http://www.infotech.ac.cn/CN/abstract/abstract836.shtml