点集合的可视化听上去很学术的样子,在实际中同学们可能对此并不陌生。最直观的例子,就是在纸上“可视”分析某某电视剧中的人物关系:在纸上画几个点代表不 同人物,然后把几个点圈在一块,“恩,这几个人看上去象地下党”;另外几个人圈一块,可能是敌特;还有,游击队,军统,中统,群众演员,等等不同的集合。 画完以后,我们就把不同的点归在不同的圈子里,表示集合;而有些集合可能会互相重合,因为有些点可能属于多个集合;即使两个集合没有共同的点,它们的图形 在二维空间中也可能重合。上面的左图就是类似例子:地图上的点表示旅馆,这些旅馆按照分类,被圈在不同的集合里。这种可视化的学术名字叫 Bubble Sets。泡泡集,听上去很可爱的样子,看上去也很可爱,每个泡泡都胖嘟嘟的。但是,当集合多的时候,这些泡泡就会重合在一块,可视化就会变的不太清楚, 比较难区分不同的集合。

为了解决这个问题,Basak Alper提出了LineSets(线集合)的方法,发表在今年的VisWeek2011上 名为Design Study of LineSets, a Novel Set Visualization Technique的论文里。这个方法是受地铁线路图的启发:除了用泡泡把点圈起来,为什么不能用不同的线把不同集合的点连在一块呢。就像坐地铁一样,沿 着线路,我们就可以把属于同一个集合的点都找到。而那些属于多个集合的点,就象是地铁线路中多条线路交叉的交通枢纽,可以着重表示。上面的右图就一个例 子,(貌似与左图显示的不是同一个集合)。

这 个方法的难点怎样把图上的点用线连接起来,而线要避免自相交和弯曲。论文对此没有详细的介绍,只是提了他们用了Lin-Kernighan的解最短路径问 题的近似算法。论文的主要部分,是通过做用户研究,论证LineSets比Bubble Sets在很多方面都要好的多。 下面的图,是基于这种方法所做的餐馆评价可视化系统。

地 图上的点表示不同的餐馆,按照风格,它们分为中国菜,墨西哥菜,印度菜等等;按照价格,从低到高,分为四类;按照评分,又被分为四档。用户可以在这三类选 择不同的组合,比如”价格中等的中菜馆,并且评分最高”,每一选择则对应与一个集合,每一个集合就对应了一条线,显然这些线的相交的点(在 LineSets ,这些点用同心圆表示),就是最符合的结果。

同学们觉得这种方法好不好呢?论文中除了地图的例子,还举了网络图的例子。如果同学们感兴趣,可以读一下这篇论文。下面这个视频是这篇论文的演示。

© 2011, 视物 | 致知. All rights reserved.

Related Posts:

  1. 俺插一句,这篇是今年InfoVis的最佳论文,但是在被公布当选之后立即遭到了围观和围攻。有个可视化博主(找了半天没找着link)和作者有几轮口水仗。
    最后夹带一点私货,俺对现在InfoVis有点演变为谈Design必谈User Study的研究方式比较不以为然。User Study本身很容易陷入bias的,而且经常就是十几个人的样本,俺觉得这样得到的数据很难有什么说服力。

    • 最佳论文不是这篇,是另一篇也跟line有关的,叫“Context-Preserving Visual Links”
      你说的博客应该是Stephen Few的Visual Business Intelligence,传送门http://www.perceptualedge.com/blog/?p=1090

      信息可视化本来就是结合心理学的东西,而心理学的研究基本都要有user study的支持,所以重视user study也正常
      但是我支持你说的几十个人的样本不太具有说服力