我们上次介绍了Robert Kosawa和Andrew Gelman关于信息可视化和统计图表的讨论。在讨论中Robert用螺旋线(Spiral)来揭示时变数据中的周期性的可视化被Andrew作为一个不好的典型进行了批评。Robert显然很不服气,在博客中发文继续深入讨论这个问题。 计算机系的果然不同,啥事都喜欢动手。他在同一个数据上实现了螺旋线可视化和统计学家建议的用堆积条形图(Stacked Bar Chart),并加在了博客里。让读者可以自己亲自动手试一下,评价一下到底哪个来表示时变数据更好。Robert觉得条形图最大的问题是,换行的时候,连续的数据被人为的断开了;而螺旋线则没有这个问题。

这个数据是1978年美国每天出生的人数。在两个可视化里都用颜色的深浅表示人数的多少。这里的目的是要发现数据中内在的周期性。这两个可视化一个重要的参数就是螺旋线和条形图的周期。当周期是20天的时候,螺旋线一圈就包括20天。而堆积条形图里 面一行也是20天。当这个参数变化的时候,数据的周期性就会变的更明显或者更模糊。Robert在他的可视化提供了滑动条来改变这个周期参数。比如下图, 当我们把周期从20天调到21天的时候,螺旋线显示出了非常明显的周期性。在周末出生的人明显少于周中,难道是因为医院周末关门吗?


接下来让我们试试用堆积条形图表示。当周期是20天的时候我们已经能看到周期性的图案。稍微调整到21天之后,结果就非常明显了。所以单从发现数据周期性的角度来说,我们实在是觉得堆积条形图比螺旋线好太多了。Robert这个例子给的适得其反阿。失败。。。我们其实在使用过程中也并不觉得条形图在换行的时候断开是个大问题。更重要是这样的堆积条形图和人们熟悉的图表相符,非常容易读懂。

这个失败的论证也告诉我们,创造发明新的数据表示方式要谨慎。在这之前要先试一下现成的基本图表是不是能有效的表示数据,满足需求。如果可以的话,就不要突发奇想创造新的可视化了。

© 2011, 视物 | 致知. All rights reserved.

Related Posts: