当我们在使用Google的时候,所输入的搜索词往往反应了我们的所思所想,甚至身体的感觉。Google不断收集这些信息,并加以分析。同学们知道这些数据分析的结果有多神奇吗?Google已经开发提供了一系列的数据分析工具Google Data Explorer, Google Trends, Google Insights for Search, Google Fusion Tables, Google Visualization API, Google Chart API, or Google Wonder Wheel,如今它又推出了Google Correlate的 服务。这项服务可以让用户比较Google搜索词的趋势和实际世界某些现象或事件的趋势,来观察两者间的关联。比如上面的图,横轴代表时间,蓝色的曲线是 由美国疾病健康中心(CDC)提供关于感冒的流行程度的数据,而红色的曲线则是人们使用Google搜索感冒治疗的统计数据。我们可以看到,两者的趋势吻 合的相当的好。而且我们还可以发现红色曲线的高峰比蓝色曲线的要提前,也就是说在美国官方得到实际数据前,Google已经能够准确的预知到未来,而相关 报道称这样的预知最多能提前2个星期。

更 厉害的是,Google还可以按照地区做相应的统计,比如结合上面的例子,Google可以知道哪些地区已经有可能要爆发流感了。这样的分析可以发掘出很 多有趣的发现,比如下面的例子中,左图显示了美国各地区的年降雨量分布,而右图显示了各个地区搜索迪斯尼度假项目的分布。两图中,颜色越深表示相对应的数 据越大。可以看出,两者有很强的关联:越是下雨多的地方,越是越多人搜索迪斯尼,进而可以推断这些人更想去迪斯尼玩。

Google Correlate允许用户输入和检索不同的搜索记录,生成相应的关联可视化。有兴趣的同学可以玩一下,看看有没有惊奇的发现。也许我们每一个人都可以成为预言家。

© 2011, 视物 | 致知. All rights reserved.

Related Posts:

    • 这个更多的是背后的大规模数据处理工作。怎么整理大量的搜索数据,然后用数据挖掘的算法找到类似的趋势是很难的事情。