如何表现有地理位置的数据是可视化很重要的一块领域。最直接的就是把数据可视化在地图上。可这是不是总是最好的选择呢?纽约时报的美术编辑Matthew Ericson在他的博客中通过举例深入的探讨了这个问题。我们在这里摘录了一些和大家分享。

首先,地图很多时候确实是包含地理信息的数据最有效的可视化方法。比如要表现单一数据,如种族,在地理位置上的分布时。下图显示的就是纽约市各个种族的分布。采用的方法就是在地图上放置不同颜色的点来表示不同的种族。我们可以很清晰的看到曼哈顿的居民主要是白人。亚裔族群主要居住在Lower Manhattan的中国城。而黑人则主要在布鲁克林。


当我们要展现的本来就是地理区域的时候,地图就是理所当然的选择了。比如在下面的图里要显示的是2010年4月的墨西哥湾原油泄漏事件中被污染的海域。通过不同的颜色来表示受污染的严重程度,非常直观的象读者传递了信息。

什么时候要选择其他的可视化方法呢?这个主要取决于可视化所要关注的问题和传递给读者的信息。下面的例子是关于2010年美国众议院选举的结果。 对于选举数据采用地图来可视化每个选区的结果是最自然不过的选择了。但是在纽约时报的这个报道里,他们要关注的是哪些选区的结果出人意料,因为这些意料之 外的获胜或失败才是真正影响选情的关键。这时候,选区的地理位置反而显得不那么重要了。所以,纽约时报的编辑们选择了下面的可视化方法。他们把各个选区按 照选情预测分为5类,从民主党大胜,小胜,平手,到共和党小胜,大胜。然后把这五类排列在5行中,用蓝色和红色标识实际的结果。这样的可视化让读者能很容 易就注意到在预期民主党获胜的那排蓝色中的少数红色。这样这个可视化设计的目的就达到了。

同样在关注奥巴马政府2012年大选策略的可视化中, 纽约时报的编辑们也采用了独特的可视化来取代地图。他们关注的问题是为什么很多人认为选举的关键在科罗拉多州和弗吉尼亚州,而不是大家习惯认为对于最后结 果起决定作用的俄亥俄州。这两个州受到关注并不是因为他们的地理位置,因此用地图的可视化并不能揭示背后的原因。纽约时报的编辑用了下面的散点图来解释给 读者。散点图的x轴是受教育程度,y轴是在08年大选中奥巴马和麦凯恩的胜负。每个州就是一个点,点的大小代表每个州拥有票数的多少。而颜色和y轴一样表 示胜负结果。假设奥巴马能依然赢得上届选举中获得大胜的州 (也就是赢了10%以上),要获得最后的胜利,他还至少需要17张选票。也就是他还要争取在10%那条线下面一些州取得胜利。哪些州对于奥巴马来说更可能 获胜呢?观察整个可视化,我们可以发现受教育程度高的州更倾向于奥巴马。而在10%的分界线之下,受教育程度最高的州就是科罗拉多和弗吉尼亚了。他们的票 数加起来是22。所以能在这两州获胜就能保证最后的当选。这些信息用地图可视化是完全没有办法展现的。

有些时候,哪怕简单的基于区域的统计数据也不能单靠地图。比如下面这个例子是关于2005年Katrina飓风中新奥尔良的受淹情况。 想要比较的是受淹地区和其他地区的居民情况,包括人种,收入等等。开始,作者采用了最直接的方法,在地图上用颜色表示各个区域的收入水平,然后再在这个地 图上标注出受淹的地区。但是效果并不好,因为受淹地区既有穷人年区也有富人区,并不象第一个例子里纽约市种族分布的那么清晰。

为了帮助读者更容易得到结论,作者选择了把具体数字计算出来,然后用下面这样列表的形式进行比较。这样我们很容易就可以看出来,主要是受淹地区黑人居民比较多,而且平均收入比较低。

最后发表的可视化,采用了下面这样地图和列表信息的组合。通过地图给读者地理区域上的信息,然后通过统计数据的列表来帮助比较。

在同学们下一次可视化地理信息的时候,建议也问问自己到底要关注一个什么问题,要传递什么信息,地图是不是最好的选择。

© 2011, 视物 | 致知. All rights reserved.

Related Posts: