admin 管理员组文章数量: 1086019
2024年3月22日发(作者:c语言inputbox函数怎么用)
什么数据?
高速发展的信息时代,新一轮科技革命和变革正在加速推进,技术创新日益成为重
塑经济发展模式和促进经济增长的重要驱动力量,而“数据”无疑核心推动力。
那么,什么“数据”呢?如果从字面意思来看,数据指的巨量数据。那么可能有人会
问,多量级的数据才叫数据?不同的机构或学者有不同的理解,难以有一个非常定
量的定义,只能说,数据的计量单位已经越过TB级别发展到PB、EB、ZB、YB
甚至BB来衡量。
最早提出“数据”这一概念的全球知名麦肯锡,他这样定义数据的:一种规模到在获
取、存储、管理、分析方面超出了传统数据库软件工具能力范围的数据集合,具有
海量的数据规模、快速的数据流转、多样的数据类型以及价值密度四特征。
研究机构Gartner这样定义数据的:“数据”需要新处理模式才能具有更强的决策力、
洞察发现力和流转优化能力来适应海量、高增长率和多样化的信息资产。
若从技术角度来看,数据的战略意义不在于掌握庞的数据,而在于对这些含有意义
的数据进行专业化处理,换言之,如果把数据比作一种产业,那么这种产业盈利的
关键在于提高对数据的“能力”,通过“”实现数据的“增值”。
数据有什么特征?
一般认为,数据主要具有以下四个方面的典型特征,即量(Volume)、多样
(Varity)、高速(Velocity)和价值(Value),即所谓的“4V”,接下来,通过一
张图来描述,具体图1所示。
图1数据4V特征
接下来针对图1中的4V特征进行简要介绍,具体如下:
1.Volume(量)
1
数据的特征首先就数据规模。随着互联网、物联网、互联技术的发展,人和事物的
所有轨迹都可以被记录下来,数据呈现出发性增长。数据相关计量单位的换算关系
如表1所示。
表1单位换算关系
单位 换算公式
Byte
KB
MB
GB
TB
PB
EB
ZB
1Byte=8bit
1KB=1024Byte
1MB=1024KB
1GB=1024MB
1TB=1024GB
1PB=1024TB
1EB=1024PB
1ZB=1024EB
2.Variety(多样)
数据来源的广泛性,决定了数据形式的多样性。数据可以分为三类,一结构化数据,
如财务系统数据、信息管理系统数据、医疗系统数据等,其特数据间因果关系强;
二非结构化的数据,如、图片、音频等,其特数据间没有因果关系;三半结构化数
据,如HTML文档、邮件、网页等,其特数据问的因果关系弱。有统计显示,目
前结构化数据占据整个互联网数据量的75%以上,而产生价值的数据,往往这些
非结构化数据。
3.Velocity(高速)
数据的增长速度和处理速度数据高速性的重要体现。与以往的报纸、书信等传统数
据载体生产传播不同,在数据时代,数据的交换和传播主要通过互联网和云计算等
实现的,其生产和传播数据的速度非常迅速的。另外,数据还要求处理数据的响应
速度要快,例如,上亿条数据的分析必须在几秒内完成。数据的输入、处理与丢弃
必须立刻见效,几乎无延迟。
4.Value(价值)
数据的核心特征价值,其实价值密度的高低和数据总量的小成反比的,即数据价值
密度越高数据总量越小,数据价值密度越低数据总量越。任何有价值的信息的提取
依托的就海量的基础数据,当然目前数据背景下有个未解决的问题,如何通过强的
机器算法更迅速的在海量数据中完成数据的价值提纯。
2
版权声明:本文标题:什么是大数据?大数据有什么特征? 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1711059594a586346.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论