信息图(infographics)和可视化(visualization)是两个容易混淆的概念,无论是刚刚入门可视化的新生,还是在此领域摸爬滚打好几年的老生,要他们立马说出这两者的区别,并不是件容易[......]

继续阅读

目前主要的图片搜索方法还是基于关键词的搜索,搜索引擎根据图片的相关标识和说明,进行文字搜索,然后把结果表示成一个长长的图片列表。很显然当这个列表很 长的时候,我们基本不可能从头看到尾。而且,关键词常常[......]

继续阅读

对于怎么样浏览海量图片这个常见的问题,谷歌是如果解决的呢?谷歌提出了一种叫Image Swirl的技术,让我们来看看它是怎么工作的。打开http://image-swirl.googlelabs.co[......]

继续阅读

前一阵子想给blog换个主题,于是就在wordpress的主题模板里找。wordpress把每个主题显示成一个图片和一段说明,并且提供了一个很传统的搜索界面:

可是,我并不精确的知道自己[......]

继续阅读

作为多元数据可视化的主要两种方法,散点图和平行坐标各有优缺点。散点图通常只能显现两个属性间的联系,但是每条数据都表示成一个点,从而减少了总的像素数 量和视觉复杂度;平行坐标能显示多个属性间的联系,但是每条数据(多条属性)表示成一条线,增加了像素的数量,当数据量很大的时候,复杂度就大大增加,而无法显示数据间的联系。2009年北大的袁晓如教授在IEEE VisWeek 上发表了篇文章【1】,提出了一种技术将两种方法结合在一块。基本的想法是在平行坐标里的轴之间显示散点图,从而使原来在平行坐标里看不清的数据趋势用散点图表示。像下面的左图显示的是平行坐标图,而右图结合了散点图。


[......]

继续阅读

散点图可以很好的显示少量属性的数据。但是,即使用散点图矩阵也无法解决属性更多的情况,而且每个小图只能显示2个属性间的联系,多个属性间的关系并不是很 直观。这种局限性主要来自将数据投影在了二维直角坐标系上。人们提出一系列的方法来解决这个局限性,而其中最著名的是1981年Alfred Inselberg 提出的平行坐标系(Parallel Coordinates)。这种方法把各个属性表示成一系列的平行的轴,组成一个平行坐标系,每条数据就表示成这个坐标系里的一条直线。比如我们有这样一 组数据

可以方便的表示成这样的平行坐标

[......]

继续阅读

多元数据是最常见的数据类型。人们经常都要作出一系列的决定,比如吃什么,买什么新手机,去哪里旅游,住什么旅馆,等等。这类决策往往是基于多元数据的分析:食物中热量有多高,碳水化合物多少,是否含有反式脂肪,[......]

继续阅读


前面我们只是列了一些最具有代表性的层次数据的可视化技术,而实际的技术有上百种之多。有意思的是竟然有人想出了一种可视化的技术来显示这些技术的联系和演变。这种可视化的结果发表在今年的IEEE Visw[......]

继续阅读

最著名的层次数据的可视化技术可能就算由Ben Shneiderman改进设计的Treemap技术。这种技术也是使用长方形。但是与前面xdiskusage所用的技术不同,Treemap巧妙的通过变换长方形的方向和嵌套长方形来表示不同的层次,并通过长方形的大小来显示节点的重要性。下面的图左边是通常见的树 型结构图。每个节点上的数值是下面低层节点上的数值和。右边的图是由Treemap生成。它把左边的层次结构转换成相互嵌套的长方形,长方形的方向则在不 同的层次变换,长方形的面积则表达了数值的大小:对应于第一层,这个区域分成三份,长方形a面积 3,b面积4,剩下面积18,a和b采用竖的方向;对应于第二层,在剩下面积18的区域里,再划分出长方形c面积5,d面积3,和剩下面积10的一块,c 和d采用横的方向;对应于第三层,剩下面积10 的区域里,划分出e面积6和f面积4,采用竖的方向。从右边的Treemap图,我们可以直观看出c和d要比e和f高级,而e和c看上去比其他的节点要重 要。

这种Treemap的技术被广泛的应用,并衍生出一些新的技术。2004年MarcosWeskamp开发出一种用来显示google新闻的技术叫Newsmap。 下面的图就是由这种技术生成,长方形的颜色代表了新闻的类型(体育,娱乐,等等),长方形的大小表示了该条新闻一共有多少篇文章/通讯社在报道。这样我们 就可以知道哪些新闻现在是热点。此外,颜色的深浅代表的新闻的时效:最近的新闻颜色会比较浅,老的就比较暗。从下面的图可以看出中国地震和Obama的竞 选是当时的两大热点。

[......]

继续阅读

信息可视化的一个研究思路是针对不同的数据类型,设计和应用不同的视觉表达方式:就像现在流行的社交网站,如果要显示其中人和人的联系,用连线图就要比表格直观的多。各种信息可视化技术的发展往往跟它所针对的数据类型有紧密的联系。层次数据是生活工作中常见的数据类型,它的可视化技术的演变就具有一定的代表性。

最常见的层次数据就是计算机中文件目录的组织(文件保存在目录里,目录可以还嵌套在其他目录里),书的结构(例如,<鬼吹灯>有上下两部,第一部有4卷,第一卷精绝古城又有32章,……),公司的结构,等等。层次数据通常表达显示为树的结构,下面两张图就是很常见的例子(公司人事结构和windows文件管理器)。

这些图很清楚的表达了层次结构,可是能不能进一步改进,使之能更多更好看的显示信息呢?比如公司里哪个部门员工最多,文件系统里哪个目录包含的文件最多最大,等等。这些问题有的看似简单,但在实际中有的却可能很重要。比如,多用户文件系统管 理,在某些情况下,系统管理员需要实时监视文件的数量和大小在各个硬盘上的存放,并进行调整。

为了解决这些问题,到目前为止,人们设计了上百种的可视化技术来显示层次数据。下面就是其中的有代表性的几种。
[......]

继续阅读