2014-09-02 18 views
2

如果您有一个关系数据库并且您想开始制作报告,您可以执行以下操作(如果这不正确,请告知我)。星形图中的维和事实表是如何相关的?

  1. 浏览关系数据库并列出要包含在报告中的所有列。
  2. 将相关的列组合在一起,然后将这些列(正常化)拆分为附加表。这些是尺寸。
  3. 维然后有一个主键(可能是两行的组合),事实表有一个外键来引用每个维,加上你首先没有分离出来的字段,比如销售值。

的问题: 我最初看到这反过来又在维引用的数据尺寸为引用的数据从外部源数据集市,和事实表..这是不正确的,不是吗?这是另一种方式...

或者一般来说,如果你要规范化数据库,你总是会替换你用外键取出表的列,然后将主键添加到新表中?

回答

3

事实表代表您要分析的进程或事件。

第1步:什么是你想分析的过程或事件?

事实表中的列代表所有与分析相关的变量。

步骤2:哪些变量与分析有关?

是否将“分隔”列转换为维度表与您的理解无关。这是一个优化,以尽量减少事实表占用的空间。

如果你想措施和尺寸来区分,问

步骤3:什么是我的事实表的(真)的数值?这些是你的措施。

真实数值的示例是美元数量,如“销售订单行项目扩展价格”。你可以总结一下或取其平均值。

一个不是真正的数字值的例子是客户ID 12345.它是一个数字,但代表不是一个数字(客户)的东西。客户id的总和没有意义,平均值也没有意义。挖?

关于你的问题:

  1. 事实表不需要外键维度表。 (提示:请参阅可热插拔尺寸)

  2. “尺寸作为引用外部数据源的数据集市”。嗯......也许,但现在不用担心数据集市。维度只是您的事实表中的一列(这不是衡量标准)。维度表只是相关维度的集合。

  3. 刚开始使用Excel。找出分析中需要的列。把它们放在Excel中。这是你的事实表。如果你期望你的事实表变得很大(百万分之一MB),那么做一个标准化水平:

找出你的措施。将它们留在事实表中。

找出你的尺寸。将它们组合在一起(将顾客信息合并到一个组中,将信息存储到另一组中

把它们放在自己的表格中。给他们无意义的代理键。把这些键放在事实表中。

+0

非常有用。谢谢! – ABMagil 2014-09-06 20:39:45