说到学术网络,通常第一反应就是基于论文间的互相引用,比如Citeology。而美国Los Alamos国家实验室的Johan Bollen和他的同事们却采用了完全不同的思路来构建学术网络。他们觉得研究人员在科研过程中,阅读论文的顺序更能反应文章之间的关系。换句话说,一个 人在同一段时间内看的论文通常是相互关联的。

但是从哪里知道科研人员在读什么论文呢?你去学术网站上搜文章,下载文章,这些一举一动都是被网站记录下来的。分析这些点击数据(Clickstream data)就能找到你读得文章。于是他们搜集了2007年和2008年间,各个学术网站上大约10亿个用户点击。这些点击涵盖了各个学科的各大主要学术杂 志和会议论文集。他们用数据挖掘的方法从这些数据中建立了上面的科学网络。在图里,每一个点表示一个杂志,而连线表示杂志相互关联。为了知道这个网络是不 是正确,他们根据Getty Research Institue的艺术科学词典中的分类,为这些点选了不同颜色。我们可以看到基本上一样颜色的点还是非常紧密的连接在一起成为一簇。而学科之间的连接相 对稀疏。在网络的外围是各种物理和工程学科。中心是艺术和哲学。所以这个从读者在网上浏览的行为分析出来的科学网络还是非常靠谱的。想要了解他们到底用了 什么样的算法来构建这个网络,请去这里读他们的论文。

可是为什么找不到计算机科学呢?让我们程序猿很失落。。。

© 2012, 视物 | 致知. All rights reserved.

Related Posts: