数据可视化技术




数据可视化技术

技术架构

解决的问题

数据可视化技术,通常被称为依靠计算机图形技术,它能有效的将大量的信息数据加以整合,将数据信息的视觉
形象和生动形象呈现在人们的眼前,以满足各种新的技术要求并达到客户的要求。如何从海量的数
据中快速提取到人们最感兴趣的内容并形象地呈现出来,是数据可视化研究的主要目标。

技术功能

  • 分类数据
  • 时序数据
  • 空间数据
  • 多元变量

a. 条形图,用长度作为视觉暗示,
利于直接比较。

b. 使用饼图、柱形堆叠图、瀑布图等,能在分类数据中对比占比情况。

c. 使用树形图,能在展示一级分类的子类统计,可实现维度的又一层下钻。

业务分析中,我们常常关心事物随着时间的变化趋势,以及数据随时间变化的规律(时间周期下的规律)。所以,对时序数据的探索,主要有两种模式:其一为随着时间线索向右延伸的时序图,诸如:折线图、堆积面积图等;其二为根据时间周期,统计汇总的柱形图、日历图、径向图等。

a.用于观察事物随时间线索变化的探索。

b.用于发现事物随时间周期变化规律的探索。

空间数据探索主要是期望展现或者发现业务事件在地域分布上的规律,即区域模式。全球数据通常按照国家分类,而国内数据则按照省份去分类,对于省份数据则按照市、区分类,以此类推,逐步向细分层次下钻。空间数据探索最常用为等值热力图,如图:

数据探索过程中,有时候我们需要对比多个个体多个变量,从而寻找数据个体间的差异或者数据变量间的关系。在这种情况下,我们推荐使用散点图、气泡图,或者将多个简单图表组合生成“图矩阵”,通过对比“图矩阵”来进行多元变量的探索。其中,散点图和气泡图适合变量相对较少的场景,对于变量5个及以上的场景我们更多地是推荐“图矩阵”。

所谓“一图解千言”,数据可视化作为大数据分析的最后一环必不可少,也越来越受到重视。

面临的问题

在大数据的应用程序中,大规模数据和高维度数据会使进行数据可视化变得困难。当前大多数大数据可视化工具在扩展性、功能和响应时间上表现非常糟糕。可视化分析过程中,不确定性是有效的考虑不确定性的可视化过程巨大挑战。

视觉噪音

在数据收集中,大多数对象之间具有很强的相关性。用户无法把他们分离作为独立的对象来显示。

大型图像感知

数据可视化不仅受限于设备的长宽比和分辨率,也受限于现实世界的感受。

可感知的交互的扩展性

可视化每个数据点都可能导致过度绘制而降低用户的辨识能力,通过抽样或过滤数据可以删去离群值。查询大规模数据库的数据可能导致高延迟,降低交互速率