admin 管理员组

文章数量: 1184232


2024年3月10日发(作者:数字化驱动产业转型)

龙源期刊网

大数据与信息可视化文献综述

作者:王怡人

来源:《工业设计》2018年第04期

摘要:本文首先对对大数据时代的数据可视化概念进行解读、辨析和研究,在理

解了大数据与信息可视化的概念之后,阐述了国内外研究现状,总结现在已有的呈现方

式、评估方式、技术手段和工具,提出了大数据时代下可视化所面临的挑战。

关键词:大数据;信息可视化;用户

数据信息可视化是近年来不断发展的交叉学科,是艺术和科技的融合。在如今信

息爆炸的时代,人们接受数据的要求是快速、高效、准确的。设计师在设计一个好的数据

可视化时,在符合信息真实性的同时,将大量的数据通过图像等手段将抽象难以理解的数

据整理成受众方便理解的形式,涉及到计算机科学、统计学、艺术设计等各种学科领域。

笔者在阅读了国内外多篇文献后将它们的各种理念,方法等总结如下。

1数据的含义 数据(Date),是用来描述科学现象和客观世界的符号记录,是构

成信息和知识的基本单元。数据是没有进行加工处理的事实,也就是说单个数据之间互不

相关,独立存在,人们用一定的方式将其排列或表达就使之间有了意义,供专业人员进行

交流、描述、解读。

龙源期刊网

大数据是具有4个特点的数据——数据量大(Volume)、变化速度快

(Velocity)、数据类型多样化(Variety)与价值密度低(Value)。从计算机技术的角

度说,大数据是结构复杂、数量庞大、类型众多的数据集合。通俗来说,大数据就是海量

资料。在效率至上的时代,其规模巨大而人工无法在较短的时间内采集、管理、处理、分

析并整理出通俗易懂的内容。从而又孕育出大数据技术——处理、管理等大数据技术。

可视化,不仅仅是可以看见,更多的是指易于理解。是把复杂的、不直观的、不

清晰、难于理解的事物变得通俗易懂,一目了然。以便于传播、交流和沟通,以及进一步

的研究。可视化不限于视觉层面,除了结合国标、文字、表格、录像等形式、也可以结合

听觉、嗅觉、触觉等感觉,并加入交互处理的技术,理论和方法,让用户易于理解。可视

化注重视觉表达、交互方式和人类的心理感知,通过对心理学、图形设计等知识等合理运

用来展现数据并有效传达其隐含意义。

2国内外研究现状

纵观最近几年的国内外大部分数据可视化的著作和论文资料,可视化在学术界的

优秀成果,可以涵盖城市数据可视化科学可视化、图可视化、高维数据可视化、人机交互

(HCI)、AR/VR、数据叙事、可视分析等多个方面。

数据可视化是从Date Visualization翻译而来。从Ben Fry的著作《可视化数

据》,Nathan Yau的著作《鲜活的数据——数据可视化指南,Julie Steele和Noah

lliinsky的著作《数据可视化之美》和Tufte、Few、cCandless等作家的可视化入门书籍

中可以得到,如何发现问题、数据收集、可视化的分类和步骤、可视化工具的选取和应用

龙源期刊网

技巧方面来对数据可视化技术的实际操作进行指导。国内的很多资料也都是从国外的网

站、文献翻译而来的。含金量较高的学术论文往往是提出最新的高效算法和对其他相关技

术的研发。在具体的可视化实现方面,在各个领域包括传统的医学、天文学等,新兴的社

会媒体、人机交互、ARNR等领域,国内外都研究在逐步地深入研究。

随着时代与技术等发展,可视化是一个高度综合的交叉型领域,深度和广度都在

不断的扩展。大量的研究专注于搜集和分析过去和现在的事件,研究如何利用现在科技更

好的展示数据,优化人机的互动,较少有利用这些信息,来寻找未来可能发生的事情。除

了让用户获取已有的信息,帮助用户及时发现之后发生的事情,对未来事件的识别和描

述,让用户未雨绸缪,及时准备,应该是一个新的研究方向。

从最近的几场可视化研讨会上,我们可以了解到可视化前沿技术的发展状况,了

解现在研究者的各种看法与观点。现在的研究内容,可以包括大规模科学数据可视化、城

市数据可视化、灵活构建可视化、新闻数据可视化、生物医学领域数据可视分析、文化遗

产应用数据可视化、理解和诊断深度学习模型等多种方向。

3呈现方式

可视化除了传统的桌面呈现方式之外,近年来,学术界又提出了多层次的可视

化、富交互多角度探索,以及通过故事叙事的形式表现分析目标。

多维度可以表现在解释数据关联趋势的多种手段,而这些手段可以是地图、图

表、图像、动画、标签云等。运用这些手段可以使可视化的过程更加直观化、关联化、艺

龙源期刊网

术化,增加了用户与数据之间等交互性。现在,多变量可视化的研究,大量是平行坐标,

散点图矩阵。研究同时还会伴随时空或层次的信息,表现这些层次上还需要努力。

富交互多角度方面,用户不仅可以在数据可视化平台上更加容易的理解数据所传

达的信息,用户也成为改进优化的一种因素。了解数据可视化的人群不只限于数据可视化

的用户,还有相当多的关注结果的观众。用户既是数据的提高者也是优化结果的观众。

随着技术的发展,交互技术和新的展示方式的发展,数据可视化已经不再局限在

平面或桌面上。AR、VR领域的研究飞速发展,越来越多的可穿戴设备让人们可以身临其

境的感受数据,深入理解数据。由此,也有一些研究人员开始研究更多自由度的交互和沉

浸式的表现。

通过故事叙事的形式表现分析目标,将数据转化为视觉共享的故事。在可视化数

据故事和一般数据可视化之间绘制一条线,缩小视觉数据故事的范围,从而促进通过数据

可视化的讲故事讲解技巧进行更好的结构化讨论。考虑到将数据转换为视觉共享的故事以

及更加集中的定义的整个过程,我们认为可以扩大视觉数据故事的研究范围。通过在视觉

数据讲故事过程中追求这些新的研究途径,可视化可以使数据更加有效的讲故事。故事除

了前面提到的线性叙述,更多的是非线性的叙述。是跳出时间先后顺序的叙事技巧。这种

技巧多运用在文学、戏剧、电影、小说和电子游戏中。设计师需要多去研究交叉学科的知

识。

动态图可视化,就是动态展现信息的图表,用户能与之交互的图表。用户用手点

一点,就可以看到自己想要了解的数据,并用动画的方式呈现出来。这样的图表,前期需

龙源期刊网

要整理数据之间的相互关系程度,逻辑思想,现在有的分析方法可以分为small

multiples和animation两类,当然还有其他的方式。实现震撼人心的视觉效果,也有不

少工具可以使用——Processing,Ocam,Adobe premiere,Adobe effecto

4评估方式

现有的图布局评估方法,如基于边交叉的方法,主要关注图的可读性;但随着大

数据时代的来临,原有的评估方法是不够的,因为包含大量数据的图通常过于复杂,导致

用户难以直接通过感知边的交叉来评估图布局的优劣。

Seok-Hee Hong提出了忠实性(Faithfulness)指标,它包括三大部分,

Information faithfulness(图布局对信息表现的忠实性),Task faithfulness(图布局

对任务的支持度)和Changefaithfulness(图布局对数据微变化的敏感度);同时提出

了基于形状的度量方法(Shape-ased Metric)来计算Task faithfulness,且通过实验证

明了这种方法的有效性。有关对力导向图和边捆绑技术等现有可视化方法的忠实性

(Faithfulness)评估,以及忠实性与可读性的比较,保持多个视图的一致性。在传统的

设计中,统一的设计要素是一种原则。在可视化中,信息图的创造和展示的时候,生成的

多个视图,可能存在不一致的现象。相同的变量可能在不同视图中以不同的方式出现;不

同的变量可能以相同的方式展现。单个图表,设计师会对其中出现的元素进行统一,多个

图表之间的一致性的要求,如何要求和确认,除了设计师自己的准则,还需要研究者进行

统一规定。

5技术手段和工具

龙源期刊网

近年来,硬件技术的不断进步和科研学者的不断研究,不少分析技术和帮助呈现

可视化效果的工具。

眼动追踪在用户研究中的作用,即帮助研究用户是如何使用可视分析界面的。与

传统的计算准确度和问卷调查等形式不同,该技术能有效捕捉用户注意力的分布情况。另

一方面,则介绍了如何通过可视分析技术来辅助对(大量)眼动追踪数据的解读。其中,

常用的两种分析方法包括Space-time cube轨迹显示法以及Map display轨迹显示法;

而针对不同类型的眼动追踪数据,如关注区(AOI)、浏览轨迹(Scan Path)和聚焦点

(Fixation)等。

来自俄亥俄州立大学的可视化小组提出了Virtual Retractor这种创新的交互式数

据探索系统,在保证数据特征的基础上对于可视化进行变形,从而解决科学可视化的3D

空间中存在着遮挡的问题。该系统采用Retractor的隐喻,允许用户像切割和分割实际物

体一样,直接操纵和探索数据。这个过程通过使带有空隙的四面体网格(tetrahedral

mesh)变形来模拟由切割产生的切口来进行。分割操作扩大了空隙,允许用户观察原来

被遮挡的内部结构。其中,网格(mesh)的构造考虑了局部数据属性,如局部数据密度

或梯度。因此,变形将受到所选数据属性的影响。具有高数据属性值的区域更加坚固,难

以变形,而属性值较低的区域将会变形。从而,变形可以保持数据中被感兴趣的特征。

以往的可视化是在桌面环境下设计的交互方式,前面也提到,各种技术的发展,

和智能设备的出现,越来越多的研究者已经开始在大屏幕、平板,移动端等设备上设计交

互方式。同时,在信息获取方面,一些可穿戴设备,特别是VR/AR等设备的重力感应,

体感检测,这些自然语言——触摸,语音输入,在可视化工作中这些交互方式都可以成为

龙源期刊网

信息输入的方式。

6结语

综合现在信息可视化的发展,面临的挑战依然是如何视觉提炼海量数据,如何将

专家知识融入分析中并获得见解,如何将挖掘的知识有效的传递给用户。这也是信息可视

化发展的初衷,不管技术如何飞速发展,所有提出来的学术理论,方法工具,都是为了让

用户更加容易理解,这还是我们的目标。

参考文献

[1] B. Lee. N. H. Riche, P. lsenberg and S. Carpendale, "More Than Telling

a Story: Transforming Data into VisuaIly Shared Stories." in IEEE Gomputer

Graphics and Applications. vol. 35, no. .84-90, Sept.-Oct. 2015.

[2]G Andrienko. N. Andrienko. M. Burch and D Weiskopf, "Visual Analytics

Methodology for Eye Movement Studies." in IEEE Transactions on Visualization

and Computer Graphics. vol 18. no 12,pp. 2889-2898. Dec. 2012

[3]D. liu et al., "SmartAdP: Visual Analytics of Large-scale Taxi

Trajectories for Selecting Billboard Locations." in IEEE Transactions on

Visualization and Computer Graphics. vol 23, no. 1 . pp.1-10, Jan 2017

[4] Quan Hoang Nguyen. Peter Eades, and SeokHee Hong JOURNAL OF

龙源期刊网

LATEX CLASS FILES, VOL. 1, N0 1. JANUARY 2016

[5] BRESCIANI, S. & EPPLER. M J. ing Tam to Information

VisuaIization: A Framework for Evaluation The Electronic Journal of Information

Systems Evaluation. 18, 46-58.


本文标签: 数据 可视化 研究 用户 信息