admin 管理员组

文章数量: 1184232


2024年3月10日发(作者:aptana公司)

摘要

摘要

在大数据时代的今天,数据正呈指数级快速增长。如何在海量数据中,快速理解

数据以及发现数据内在的信息规律,是大数据时代亟需解决的问题。数据可视化技术

作为一门新兴学科技术,通过将数据映射为可视化图形,为人们认识数据、理解数据、

发现数据规律提供了一种方便、高效的途径。目前,数据可视化应用软件的实现大都

基于C/S结构,这些软件往往专业性强、用途单一、可扩展性较弱。作为互联网主流

技术之一,Web前端技术不仅为基于B/S结构的数据可视化系统实现提供了良好的跨

平台性、易扩展性、以及丰富的交互性,而且为数据的可视化展示提供了互联网平台,

使得数据具有良好的访问性以及较强的理解性,采用Web前端技术实现数据可视化

已经成为一种趋势。

本文针对低维数据和多维数据的可视化方法进行研究,采用Web前端技术实现

了数据可视化系统并采用实际案例加以测试验证。本文主要研究内容如下:

1、研究了低维和多维数据可视化技术、Web前端技术以及可视化技术框架,并

对基于ECharts3.0的平行坐标可视化交互操作进行扩展改进。

2、提出了基于主成分分析的平行坐标(PCAP)可视化方法和基于主成分分析和

聚类的平行坐标(PCAKP)可视化方法。针对维数过高带来的平行坐标可视化的轴

间距过窄、可视化线条密集拥挤问题,本文提出PCAP方法,该技术采用主成分分析

(PCA)方法对多维数据进行降维处理,并对得到的数据进行平行坐标可视化处理,

有效改善了平行坐标的可视化效果。针对维数过高、数据量过大带来的平行坐标可视

化线条密集交叠,无法快速获取数据特征和规律的问题,本文在PCAP技术基础上提

出PCAKP方法,该方法对PCAP方法中降维处理后的数据采用K-means聚类算法进

行聚类处理,再采用平行坐标可视化方法对聚类后的数据进行可视化展示,不仅有效

改善了平行坐标可视化效果,而且能够从可视化图形中快速获取数据特征和规律。

3、设计和实现了数据可视化系统。根据数据可视化系统的需求分析,设计了可

视化系统的工作流程、Web前端功能模块、数据可视化流程设计以及Web界面原型

图,并采用Web前端技术及其可视化框架实现了数据可视化系统。最后结合实际案

例在可视化系统中的测试应用,验证了系统的实用性和有效性。

本文通过对数据可视化技术的研究,采用Web前端技术以及可视化框架实现了

数据可视化系统,解决了多维数据维数过高、数据量过大带来的问题,达到了可视化

图形理想情况,实现了数据特征以及规律易发现的效果。

关键词:Web前端技术, 数据可视化, 平行坐标, 主成分分析, K-means聚类

I

ABSTRACT

ABSTRACT

In the era of big data, data is growing exponentially. How to comprehend the data quickly

and discover the inherent information of the data is an urgent problem to be solved. As a

new technology, data visualization provides a convenient and efficient way for people to

know data intuitively, comprehend data quickly and discover the rules of data by mapping

the data to visual graphics. At present, the realization of data visualization application

software is based mostly on C/S structure. This application software, usually with single

usage and bad cross-platform characteristics, is often highly professional. As a mainstream

Internet technology, Web front-end technology provides not only extensive applications,

good cross-platform characteristics and better visual interaction results for the realization

of data visualization based on B/S structure, but also Internet platforms for data

visualization representation, all of which make data more available and understandable. It

has become a trend to realize data visualization based on Web front-end technology.

In this thesis, data visualization technology of low dimension data and multi-dimension

data are researched. Based on these researches, Web front-end technology is exploited to

realize the data visualization system and consequently some practical application cases are

used to verify the visualization system. The contributions of this thesis are summarized as

follows:

1. Researches on low-dimensional and multidimensional data visualization technology,

Web front-end technology and visualization technology framework are done. Besides, the

interoperability of parallel coordinate visualization technology based on Echarts3.0 is also

extended in this thesis.

2. A PCA-based parallel coordinate visualization method (PCAP) and a PCA and cluster

based parallel coordinate visualization method (PCAKP) are proposed. Because of the high

dimension, the data visualization of multidimensional data usually causes high density of

lines and narrow distances between coordinate axes of parallel coordinate plots. In order to

solve the problem, a PCAP method is proposed. In this method, PCA is used to reduce the

dimension of multidimensional data and then parallelization processing is taken on the

dimension-reduced data, all of which effectively improve the visualization results of

III


本文标签: 数据 可视化 技术 系统 平行坐标