admin 管理员组

文章数量: 1086019


2024年3月22日发(作者:c语言inputbox函数怎么用)

什么数据?

高速发展的信息时代,新一轮科技革命和变革正在加速推进,技术创新日益成为重

塑经济发展模式和促进经济增长的重要驱动力量,而“数据”无疑核心推动力。

那么,什么“数据”呢?如果从字面意思来看,数据指的巨量数据。那么可能有人会

问,多量级的数据才叫数据?不同的机构或学者有不同的理解,难以有一个非常定

量的定义,只能说,数据的计量单位已经越过TB级别发展到PB、EB、ZB、YB

甚至BB来衡量。

最早提出“数据”这一概念的全球知名麦肯锡,他这样定义数据的:一种规模到在获

取、存储、管理、分析方面超出了传统数据库软件工具能力范围的数据集合,具有

海量的数据规模、快速的数据流转、多样的数据类型以及价值密度四特征。

研究机构Gartner这样定义数据的:“数据”需要新处理模式才能具有更强的决策力、

洞察发现力和流转优化能力来适应海量、高增长率和多样化的信息资产。

若从技术角度来看,数据的战略意义不在于掌握庞的数据,而在于对这些含有意义

的数据进行专业化处理,换言之,如果把数据比作一种产业,那么这种产业盈利的

关键在于提高对数据的“能力”,通过“”实现数据的“增值”。

数据有什么特征?

一般认为,数据主要具有以下四个方面的典型特征,即量(Volume)、多样

(Varity)、高速(Velocity)和价值(Value),即所谓的“4V”,接下来,通过一

张图来描述,具体图1所示。

图1数据4V特征

接下来针对图1中的4V特征进行简要介绍,具体如下:

1.Volume(量)

1

数据的特征首先就数据规模。随着互联网、物联网、互联技术的发展,人和事物的

所有轨迹都可以被记录下来,数据呈现出发性增长。数据相关计量单位的换算关系

如表1所示。

表1单位换算关系

单位 换算公式

Byte

KB

MB

GB

TB

PB

EB

ZB

1Byte=8bit

1KB=1024Byte

1MB=1024KB

1GB=1024MB

1TB=1024GB

1PB=1024TB

1EB=1024PB

1ZB=1024EB

2.Variety(多样)

数据来源的广泛性,决定了数据形式的多样性。数据可以分为三类,一结构化数据,

如财务系统数据、信息管理系统数据、医疗系统数据等,其特数据间因果关系强;

二非结构化的数据,如、图片、音频等,其特数据间没有因果关系;三半结构化数

据,如HTML文档、邮件、网页等,其特数据问的因果关系弱。有统计显示,目

前结构化数据占据整个互联网数据量的75%以上,而产生价值的数据,往往这些

非结构化数据。

3.Velocity(高速)

数据的增长速度和处理速度数据高速性的重要体现。与以往的报纸、书信等传统数

据载体生产传播不同,在数据时代,数据的交换和传播主要通过互联网和云计算等

实现的,其生产和传播数据的速度非常迅速的。另外,数据还要求处理数据的响应

速度要快,例如,上亿条数据的分析必须在几秒内完成。数据的输入、处理与丢弃

必须立刻见效,几乎无延迟。

4.Value(价值)

数据的核心特征价值,其实价值密度的高低和数据总量的小成反比的,即数据价值

密度越高数据总量越小,数据价值密度越低数据总量越。任何有价值的信息的提取

依托的就海量的基础数据,当然目前数据背景下有个未解决的问题,如何通过强的

机器算法更迅速的在海量数据中完成数据的价值提纯。

2


本文标签: 数据 价值 处理 特征 海量