bestiario.org提出了一种新的度量世界上的城市间的距离的方法。这样度量方法叫做信息距离(informational distance),基本思路是基于google的搜索结果:对于两个城市,数数有多少页面显示这两个城市之间有一定的联系,有多少个页面显示这两个城市没有联系,然后根据这两个数目算出两个城市间的联系强度。这个联系强度乘以地理距离,然后取倒数,就是信息距离:直观的说,地理距离远但是联系强度大,说 明信息距离近(数值小)。bestiario.org还提供了程序来可视化这种距离:两两城市间用红线连接,线越粗,表示信息距离越近。

从上面显示的图来看,目前这种方法的绘制结果并不是最好,还有很多改进的空间,但是这种信息距离的定义还是很有意思,比如转动地球,我们可以看到纽约和伦敦虽然地理距离很远,但是信息距离却很近。另外,有些结果并不符合我们的常识,比如北京上海的距离,与北京到东京的距离差不多。通过网站提供数据来看,他们只考虑的google 搜索的英文结果,可能这是造成误差的主要原因。

© 2011, 视物 | 致知. All rights reserved.

Related Posts: