2011-07-27 64 views
0

我们计划为一大组事件(大约数百万)构建数据探索系统。 事件由时间,纬度/经度坐标和一些其他属性组成,这些属性具有类型和userId等域限制值。探索和分析大数据的体系结构

的目标是提供数据的可视化上三米板:

  • 地图(标记或在热图聚集事件)
  • 时间直方图(按日期事件的分布)
  • 属性直方图(属性的直方图:类型,用户,......)

用户将交互通过对属性(小面),时间间隔或空间范围滤波向下钻取数据。

我们正在考虑使用OLAP服务器,但不知道这是否是最合适的解决方案。

哪个体系结构/系统可以在如此庞大的数据集上处理此操作? 有关于此的任何经验或建议?优选用开源组件。

感谢

回答

0

形式上,MathGL可以办理(变更,使柱状图,曲线图等),这样的数据很容易地设置。通常情况下我绘制更大的数据集(高达几Gb或大于1e8的数字)。 MathGL是免费的(GPL和部分LGPL)绘图库。