%0 Journal Article
%T 提取方正排版文件广义元数据并生成全文HTML的探索
%A 徐用吉
%A 杨海亮
%J 中国科技期刊研究
%D 2016
%R DOI:10.11946/cjstp.201509280939
%X 【目的】实现自动提取科技期刊全文元数据并生成HTML文件。【方法】 以方正排版文件为对象,在可以提取出来文章的标题、摘要等元数据的基础上,将文章的正文内容元数据化,提出了包含图、表、公式等的广义元数据概念,并建立了提取图、表元数据的提取规则,同时将方正排版数学公式转化为LaTeX表达式。然后利用VB编程软件编写了自动提取广义元数据程序并将元数据重新组合生成HTML格式的文件。【结果】 根据方正BD排版语言的特点,建立的提取规则能有效提取全文并元数据化,最后可直接生成HTML文件。【结论】 实际应用表明了利用广义元数据生成HTML文件的有效性和可行性
%K 广义元数据 方正BD排版语言 VB编程软件 自动全文提取 HTML文件
%U http://cjstp.ijournals.cn/cjstp/ch/reader/view_abstract.aspx?file_no=20160214&flag=1