2014-02-26 120 views
1

我是Data Warehousing的初学者。我们已经创建了一个数据集市,一个星型模式设计来加载季度数据。我们一直在根据当季业务批准的情况加载当前数据。数据仓库 - 在事实表中存储历史数据

现在我们有要求回去加载历史数据(3年约40GB)。加载这些数据的尺寸将与用于qauer加载的尺寸相同。但是,我们可以将这些历史数据加载到同一个事实表中,还是必须创建一个重复的事实表来单独加载历史数据?这是DW标准吗?我试图按照标准来找到这样做的方法。

当前事实表是在load_cycle_date上进行分区的日期,它指定数据加载的季度。

非常感谢!

+0

DW包含历史数据,汇总数据,您关心什么? – rano

+0

嗨RanoMy关注的是如果历史数据(合并3年)可以加载到我们一直用来加载季度数据的同一个事实表中。 – user3357452

+0

假设你只从现在开始在接下来的三年中插入季度数据,会发生什么变化? – rano

回答

0

我不明白为什么获取历史数据和使用较旧的load_cycle_dates将不适合您现有的表。这假设你能够将它们转换成这种格式。这是基于多年来数据结构发生了多大变化。

有你需要寻找到其他领域:

  1. 你有你所有的尺寸足够的历史价值?例如:客户评级。可能有客户最终得到“差”评级,但事实并非如此。每次更改都需要记录。另一种方法是从备份中提取数据。
  2. 审批流程 - 通常很多数据差异在直到启动时才会被发现。因此,应用程序可能会进行更改以进行这些更正。您可能会发现某些报告是以“先前的数据仓库”数据运行的,因此不准确。

没有理由不应该在一个季度内完成并测试它。这是你肯定知道的唯一方法。我所使用的当前数据仓库在仓库启动之前经历了添加数据的相同过程。转化非常普遍。