同学们还记得上次我们关于可视化中冗余信息的讨论吗?在其中我们列举一幅足球运动员在某场球赛中场上位置停留时间的可视化。为了方便同学们复习,我们再把这个作业拎出来。

在上面的图中,颜色和柱子的高度都代表了运动员停留时间的长短。其实这种信息冗余的使用并不少见,比如最近笔者在翻财富杂志,就看到了下面这张图。

这 张图显示了Chipotle连锁饭店在美国各个州的数目,其中对应于每个州的柱子和颜色都表示了数目的大小,更绝的是在每个柱子上还都标明了具体的数字。 这个可视化用了不同的元素表达同一组数据,虽然看上去信息冗余,但是笔者认为这不失信息传递的快速性和准确性。可能对于统计专家而言,使用heat map 或者在每个州上直接写个数字,也就足够来表明同样的数据。但是对于大众读者而言,这个可视化显然要美观很多。

下面的图使用了类似的彩色柱子。这个可视化是 由GE制作,用来显示在不同年份里,美国每个州人口出生和温度的关系。其中颜色表示了各个州的温度跟全国平均温度的差别,红色表示差别大,蓝色表示差别 小,温度差别在正负5度;柱子的高度表示各个州出生人口跟全国平均出生人口的差别,高表示高于平均水平,低则相反,人口差别在正负8千;拖动下面的时间 轴,各个州的颜色和高度会做相应的变化。相比上面的“傻瓜”可视化,这个可视化增加了数据表达的丰富程度,可能对于统计学家而言,减少了冗余信息,不同的 元素映射到了不同的数据(两种属性在地理上随时间变化),但是同时对于读者而言,可能也需要花相对更多的时间来理解(有些地方,比如蓝色的柱子反而比红色 的高,并不是非常符合读者的直觉)。也许这种平衡还需要可视化作者针对不同的应用,不同的读者来斟酌。

© 2011, 视物 | 致知. All rights reserved.

Related Posts: