文本云(Tag Cloud)是一种常用的文本可视化方法。我们也曾经介绍过一些在线的文本云制作可视化工具,比如WordleTagxedo。但是这两个工具还是有一些局限性,用户并不能随心所欲的定制个人化的文本云。Jason Davies最近用基于Javascript的可视化开发语言d3.js写的在线文本云就 提供了非常多的定制选项。你可以通过页面上的各种控制,调整字体,文字的大小比例,标签放置的算法,倾斜的角度,甚至包括颜色的选项等等来个人化你的文本 云。它同时还支持对一些社会媒体中选定关键字的分析。比如上面的图里显示的是对维基百科中包含visualization的页面的文本分析。我们可以看到 和visualization同时出现在维基百科页面的词中比例比较高的是Information和graphics。但是也出现了一些比如 wikipedia, true, false这样的每个维基页面上都大量出现的词 ,我们称这些次为Stop-word。可见它只是做了非常简单的词频统计。毕竟这只是个可视化工具,自然语言处理算法并不包括在内。

我们觉得通常大家阅读文字的习惯还是横的或者竖的,对斜排的文字很不敏感。于是我们可以通过调整角度来的到像下面这样的效果。是不是清楚很多了呢?

这个文本云可视化工具还允许你粘帖你自己的文档来生成可视化。也可以把结果输出成PNG或者SVG格式保存。SVG因为是矢量图,可以无损的放大缩小,所以非常有用。但是和别的文本云制作工具一样它也有一个缺点,就是它不支持中文。

© 2012, 视物 | 致知. All rights reserved.

Related Posts: