1
我有一吨的样品按以下格式:直方图数据仓库
<timestamp> <dim1> <dim2> <dim3> 324
<timestamp> <dim1> <dim2> <dim3> 3565
<timestamp> <dim1> <dim2> <dim3> 122
<timestamp> <dim1> <dim2> <dim3> 2333
324,3565,...是测量,我想这些存储在数据仓库中。
度量将四舍五入到最接近的一百(300,3600,100,2300)。
我该如何存储并快速创建事实的直方图?
一个坏的方法是在事实表中为每个“桶”(即100,200,300,...)设置一列,然后在每列上使用SUM()来构建直方图。缺点是显而易见的:事实表将是巨大的和非灵活的(范围有限的样本)
任何人有任何聪明的想法?