6

我正在移动设备上实施标签云。数据模型等的细节在这里并不特别重要。我的问题是关于标签的缩放比例:关于缩放标签云中的标签

将标签频率映射到字体大小的“最佳”表达式是什么?

我看过this post讨论线性和对数比例尺和this answer来自阿德里安库恩草图的多项式方法的灵感。然而,我似乎记得在这个问题上有更多的探索,在互联网上发布了一些帖子。

我在博客上也发现了一些“best practices”,但我不确定最佳实践的意义。这些对频率缩放没有评论。

对于标记缩放还有哪些选择,哪些是首选/标准方法?我也在考虑最小的字体大小,最大数量的标签,颜色等。

编辑:根据this question的讨论,我对“标准”tagcloud感兴趣,字体大小有所不同。

+0

呃,退房本网站的右栏 - 按降序排列的实例数排序,右边的数字排序。适用于我。 – Benjol 2009-08-25 11:20:21

回答

3

我去年一个小标签云项目,其中我沿着

β=(INT)(((maxθ - minθ)×ω)+minθ+ 0.5)的线使用的东西的工作
其中ω是根据某个度量(以您的字体频率)计算的加权,minθ和maxθ是下限和上限,β是最终值。这可以应用于任何视觉特征(字体大小,颜色,重量,如果支持等)。

我发现线性和对数缩放倾向于依赖于数据集分布。在突出异常值的数据集中,我发现tanh对于“平滑”结果值很有用。

+0

这是我最终选择的线性缩放比例。好主意re:tanh,我会再看看。 – jamesh 2010-10-28 14:00:40

2

this pdf中有一个很好的讨论,它讨论了要显示的标签上的缩放,聚类和截断。

0

溶液我发现作品很好地是如下

font_size = (max_font_size - min_font_size) * (Math.sin(1.5*(X)) + minsize

其中X是要映射到的字体大小归一化的值

X = (this_value-min_value)/(max_value-min_value)

这增加尺寸差为降低3个四分位的范围,例如以最小化高异常值的影响