数据可视化的基本原理——视觉通道

4,017 阅读6分钟

数据可视化为了达到增强人脑认知的目的,会利用不同的视觉通道对冰冷的数据进行视觉编码。

我们在数据可视化的时候,一方面,展现可视化对象本身的位置、特性,对应的视觉通道类型是定性或者分类,比如汽车在什么地方、汽车的种类;另一方面,展现对象的某一个属性值大小,对应的视觉通道类型是定量或者定序,汽车的油耗、汽车加油的排队顺序。

那么,有哪些具体的视觉通道呢?下面就跟大家介绍几种常见的视觉通道,文末有视觉通道的表现力排序图,心急的记住这个图就可以了。

用于分类的视觉通道

位置

平面位置在所有的视觉通道中比较特殊,一方面,平面上相互接近的对象会被分成一类,所以位置可以用来表示不同的分类;另一方面,平面使用坐标来标定对象的属性大小时,位置可以代表对象的属性值大小,即平面位置可以映射定序或者定量的数据,比如下面会讲到的「坐标轴位置」。

平面位置又可以被分为水平和垂直两个方向的位置,它们的差异性比较小,但是受到重力场的影响,人们更容易分辨出高度,而不是宽度,所以垂直方向的差异能被人们快意识到,这就解释了为什么计算机屏幕设计成 16:9、4:3,这样的设计可以使得两个方向的信息量达到平衡。

色调

我们认识色调只会从定性的角度,平常我们所说的「冷暖色调」,就是我们看一个东西、一幅图,它所表现出来的情感强烈程度,这没法从定量的角度去判别冷艳或是热烈的色调。

认识色调,我们要明白这三点:

  1. 纯色就是色调
  2. 向纯色(色调)增加黑色就构成了暗色
  3. 向纯色(色调)增加白色就构成了亮色

形状

形状所代表的含义很广,一般理解为对象的轮廓,或者对事物外形的抽象,用来定性描述一个东西,比如圆形、正方形,更复杂一点是几种图形的组合。

图案

图案也被称为纹理,大致可以被分为自然纹理、人工纹理。自然纹理是自然世界中存在的有规则模式的图案,比如树木的年轮;人工纹理是指人工实现的规则图案,比如中学课本上求阴影部分的面积示意图。

由于纹理可以看作是对象表面或者内部的装饰,所以可以将纹理映射到线、平面、曲面、三维体的表面中,以分类不同的事物。

用于定量/定序的视觉通道

坐标轴位置

坐标轴上的位置就是前面的位置中的定量功能,使用坐标轴对数据的大小关系进行定量或者排序操作。

长度

长度也可以被称之为一维尺寸,当尺寸比较小的时候,其他的视觉通道容易受到影响,比如一个很大的红色正方形比一个红色的点更容易让人区别,人们对很小的形状也无法区别。

根据史蒂文斯幂次法则,人们对一维的尺寸,即长度或宽度,有清晰的认识。随着维度的增加,人们的判断越来越不清楚,比如二维尺寸(面积)。因此,在可视化的过程成,我们往往将重要的数据用一维尺寸来编码。

角度

角度还有一个名字叫做「方向」,方向不仅仅可以用来分类,也可以用来排序,这得看我们可视化的时候选择什么样的象限。

在二维可视化的世界里,四个象限可以有三种用法:

  1. 在一个象限内表示数据的顺序
  2. 在两个象限内表现数据的发散性
  3. 在四个象限内可以对数据进行分类

面积

面积在前面的尺寸已经讲过了,就是二维的尺寸。

亮度/饱和度

亮度(luminance)是表示人眼对发光体或被照射物体表面的发光或反射光强度实际感受的物理量[3]。简而言之,当任两个物体表面在照相时被拍摄出的最终结果是一样亮、或被眼睛看起来两个表面一样亮,它们就是亮度相同。在可视化方案中,尽量使用少于 6 个可辨识的亮度层次,两个亮度层次之间的边界也要明显

饱和度指得是色彩的纯度,也叫色度或彩度,是“色彩三属性”之一。如大红就比玫红更红,这就是说大红的色度要高。饱和度跟尺寸有很大的关系,区域大的适合用低饱和度的颜色填充,比如散点图的背景;区域小的使用更亮、颜色更加丰富、饱和度更高的颜色加以填充,便于用户识别,比如散点图的各个散点。小区域使用的饱和度通常只有 3 层,大区域的可以适当增加一些

图案密度

图案密度是表现力最弱的一个视觉通道,在实际应用中很少看到它的身影。可以把它当作成同一形状、尺寸、颜色的对象的集合,用来表示定量或定序的数据。

用于表示关系的

包含

包含是将相同属性的对象聚集在一起,并把他们囊括到一个区域,这个区域与其他区域具有明显的分界线,比如方框、圆形等等

连接

连接关系在表示网络关系型数据中使用,比如邮件收发关系中,收件人与发件人之间的关系,使用线段进行连接,表示他们之间具有一定的联系。

相似

相似经常和颜色进行搭配使用,属性类似的对象之间的关系使用相同色调,不同亮度的颜色进行表示。

接近

如果说相似借用颜色来聚类属性相似、相同的对象,那么接近就是利用距离来表示这些对象。这可以体现在设计原则中的亲密性原则,相同性质的事物应该放在一起。

最后说一点

视觉通道的分类不是唯一的,比如位置信息,既能区分不同的分类,又可以用来表示连续数据的差异,所以在数据可视化的过程中,我们应该根据需要做一定调整。

表现力排序表

参考文献

[1] 陈为, 张嵩, 鲁爱东. 数据可视化的基本原理与方法[M]. 科学出版社, 2013.

[2] RobinWilliams. 写给大家看的设计书[M]. 人民邮电出版社, 2016.

[3] https://zh.wikipedia.org/wiki/%E4%BA%AE%E5%BA%A6


欢迎大家关注微信公众号:可视化技术( visteacher )

不仅有前端和可视化,还有算法、源码分析、书籍相送

个人网站:blog.kurryluo.com

各个分享平台的 KurryLuo 都是在下。

用心学习,认真生活,努力工作!