全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

基于web的专利双语语料自动获取研究及实现*——以esp@cenet数据库为例

Keywords: 专利,著录信息,双语平行语料,网页解析

Full-Text   Cite this paper   Add to My Lib

Abstract:

?针对专利资源,研究一种有效地从专利数据库中获取高质量双语对译语料的方法。该方法利用网页的url命名特点获取专利数据的详细网页,以实现网页的批量下载,并通过网页解析,采用正则匹配表达式提取出网页上的所需信息,合并数据后形成双语对照的语料数据库。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133