2013-03-01 89 views
2

有一个数据集,其中包含汇总数据 - 汇总到各个维度,并且小到每小时级别。主要的措施是速度,它只是文件大小除以持续时间。如何汇总/汇总百分比度量

要求是查看百分位数,中位数和平均/平均值汇总。

均很简单,因为我们只需创建在MDX计算的度量,然后它在所有聚合级别,即每日/每月等

然而百分位和中位数是很难的。有什么办法可以对这些功能进行计算,这些功能会正确地卷起来?当我们读取原始数据时,我们可以在ETL中添加百分比速度作为列,但是我们仍然需要找到一种方法,然后将其进一步卷积。

什么是适当的方式来卷起这些类型的措施?寻求百分位数的情况并不少见,所以当我环顾四周时,我很惊讶地没有看到这方面的信息。

也许唯一的方法是将各种汇总表放在正确的级别,并进行正确的计算,然后让mondrian将它们用作agg表?或者更糟糕的情况下有多个立方体(!)

回答

1

好吧,所以事实证明你不能卷起百分点(因此中位数仅仅是第50百分位数)。我了解其他人有这个问题,请看这里来自Kasper的推文: https://twitter.com/kaspersor/status/308189242788560896

因此,我们的解决方案是存储相关统计信息的几个不同的聚合表,以及存储预先计算的百分位数和中位数统计信息的主要(已汇总的)事实数据表。