|
江苏农业科学 2019
基于ETL-KETTLE模式的苹果产业数据整合Keywords: 苹果产业,ETL,KETTLE,数据,整合,应用 Abstract: 苹果是高附加值的果品,也是世界四大水果之一。苹果产业在千余年的发展过程中,积累了丰富的数据资源,这些资源也是产业数据分析的基础和关键。由于苹果产业的数据来源丰富、结构各异,因此,数据的集成和共享还存在一定的难度,对数据进行整合十分必要。以国家科技图书文献中心篇名含“苹果”的数据资源为材料,以基于ETL-KETTLE的数据转换模式为研究方法,提出面向苹果产业数据整合的思路。结果表明,基于ETL-KETTLE的数据整合法则,可以分析苹果产业多源异构数据的关键节点、过滤和清洗噪音数据、发现和解析多源数据的字段,最后通过表输出完成题目、摘要、关键词等字段的统一,从而实现苹果产业数据的整合。将基于ETL-KETTLE模式的整合方法应用于苹果产业,可以为产业数据的重组与共享提供科学的工具,为数据的高效获取和有效组织表达提供新的思路和方法,助力苹果产业的科技创新,提升苹果产业的国际竞争力
|