admin 管理员组

文章数量: 1086019


2024年5月5日发(作者:小数转化为二进制数)

元数据管理方案

元数据管理方案

1.1 元数据抽取

为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。通过

元数据自动抽取,用户可以方便、快捷地获得大量的元数据信息。

1.1.1 抽取的对象

元数据抽取主要针对的对象有以下几种:

已有目录:已建业务应用系统中现有的目录资源。

数据库:各种数据库资源,包括关系型数据库、XML数据库等。

格式化电子文件:电子文件,例如Word、PDF、XLS等文件。

1.1.2 元数据抽取的流程

元数据抽取的流程有4个主要步骤,分别为:

数据源信息获取:解决要从哪个数据源获得元数据的问题。

内容/结构分析:解决要从数据源中获得哪些元数据的问题。

元数据提取:解决如何从数据源中获取元数据的问题。

存储入库:解决元数据存储的问题。

1.1.3 电子文档的元数据抽取

对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,

同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存

放的,甚至已经建立了完善的电子系统进行管理。

针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程:

 整理归档

对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统


本文标签: 数据 文档 抽取 电子