怎么从FAN来检测犯罪呢?同学可以开动脑筋想想。一个最直观的发现是,如果是普通老百姓,那么他们的金融活动就比较简单,最多也就在一两家或者少数几家银 行间倒点工资啊,买菜钱啊等等,他们在FAN里对应的节点就表现的比较简单,只连接少量的边;但是如果一个人跟多家机构有关系,从事复杂的倒钱活动,那么 他们在FAN里对应的节点就比较复杂,往往连有大量的边。所以先要把这些复杂的节点给挖出来。

VisFAN 使用了一种基于k-core概念的聚类分析(clustering)方法。什么是k-core?在FAN里每个节点都连有一定数量的边。k-core就是指FAN里边数至少为k的点所组成的子图。比如 k = 4, 那么我们就把FAN里边数至少为4的点找出来,然后它们所组成的子图就是4-core所对以的子图。这样的话,我们就可以把一张复杂的FAN分解成不同k 的子图。比如下面这张图,(a)就显示了分解后的图,我们也可以把这样的分解结果表示成树的形式,象(b)显示的那样。

image courtesy of Walter Didimo, Giuseppe Liotta, Fabrizio Montecchiani,Pietro Palladino

在应用上面这种聚类分析方法前,我们还要对原始的FAN做预处理。原始的FAN的包括了交易金额的节点,这些节点往往只有两条边,连接了人或者银行。而聚类分析主要要找出那些边很多的人,所以我们可以先把这些交易金额的节点去掉。然后做聚类分析,做完以后再把它们放回去。比如下面这张图,(a)就是原始的 FAN,黑色的是交易金额的节点;(b)是去掉这些节点后的FAN;然后做聚类分析,得到(c);最后把去掉的节点在补回去得到(d)。

image courtesy of Walter Didimo, Giuseppe Liotta, Fabrizio Montecchiani,Pietro Palladino

有了聚类分析的结果,那么我们找可疑人物就容易多了。文章里举了下面这个例子。图中Peter Jackson连接到了John Doe 和 Eric Yale。 后两者分别属于不同的聚类,并且属于中心人物,有大量的连接。不用说,就是他们了!(文章指出这两个聚类符合典型的犯罪模型,而且边数越多,犯罪级别就越 高。)文章虽然没有明说,但是也可以看出Peter Jackson可能也是个堂主之类的角色,虽然他只有两条边^_^。

image courtesy of Walter Didimo, Giuseppe Liotta, Fabrizio Montecchiani,Pietro Palladino

© 2011, 视物 | 致知. All rights reserved.

Related Posts: