2016-12-15 87 views
0

我有五个立方体必须每晚更新。他们都使用我数据仓库中的大事实表。我的事实表在主键上有一个非聚簇索引,在逻辑键上有一个聚簇索引。我的事实表是按年划分的。立方处理速度太慢

由于数据可能发生变化,被删除或新的数据可能会到达,因此我正在对所有立方体执行完整处理。只有过去730天(两年)的数据才会发生变化,所以也许有办法只处理这段时间?

我试过在同一时间和彼此之后处理所有的立方体。两次处理都花了很长时间。

回答

3

有许多的优化,你可以做些什么来帮助提高处理多维数据集的:

  1. 建立定期分区的多维数据集和处理对特定时间段的分区。例如,您可以构建年度分区,然后处理这两年,这样它只能访问该数据。
  2. 将processFull的多维数据集分区处理拆分为processData和processIndexes。对它们进行计时,以免在同一时间超载源或多维数据集服务器。

这些是多维数据集处理的前两个问题 - 也检查出Analysis Services Processing Best Practices

为了进一步调试,您可能还需要确定处理速度如此之慢的原因 - 它是在源服务器本身还是在使用多维数据集本身。一个很好的指导是Analysis Services Operations Guide

HTH!

+0

另一个很好的来源(从基准角度)的亨克 - > http://henkvandervalk.com/how-to-process-a-ssas-molap-立方体的快速-AS-可能部分-1 –

0

下面是一些想法

分区:我与丹尼李完全同意,你应该在你的立方体实现分区。 (这显然会提高你的处理时间)

问题 - 5个立方:你告诉我们,你对SAME大的事实表5米的立方体。我的问题是:“你真的需要五个立方体而不是一个吗?” < - 如果您可以在一个立方体中实现您的需求,您的问题将会减少。

并行多维数据集处理:您尝试以并行或线性模式运行,您可能会尝试以线性模式运行它,但在同一时间运行2个。

群集列存储索引:您似乎在SQL Server 2014上 - 如果您拥有企业许可证,则可以尝试将聚簇索引更改为群集列存储索引。

让我们知道您的更改,
阿尔诺