2010-06-15 34 views

回答

1

你可以找到我的博客上一大堆更多的信息:http://danLinstedt.com,并在datavaultinstitute点com

但给你一个快速/简短的回答你的问题的论坛:

的陷阱是如下所示:

1)必须接受将原始数据加载到数据仓库的概念 2)了解Data Vault通常不允许由于模型而导致“最终用户”直接访问。

可能还有一些,但好处大于缺点。

随时检查博客,它是免费注册/关注。

干杯, 丹Linstedt

1

我们一直在使用一个土生土长的修改Data Vault了数年,名为“Link建模”,其中只有实体和链接;从neo4j绘制原理,但是在SQL数据库中实现。

链接建模和数据保险库对Kimball/Inmon模型的思维方式有很大的不同。

我在下面的评论涉及到使用以下结构构建的系统:一个临时临时数据库,一个DWH,然后是一些DWH构建的集市。还有其他方法可以构建DWH解决方案,但这是非常典型的。

随着金博尔/ Inmon

  • 数据被清洁的方式进入DWH,但有时施加在途中到临时数据库
  • 业务规则和MDM是(通常)所施加的之间Staging数据库和数据仓库
  • 的集市是特定往往受到区域

随着数据保险库/链路建模

  • 数据以分期
  • 这些数据是通过传递到DWH也未清洗降落不变,而是存储在实体/链接形式
  • 数据清理,MDM和商业规则适用于DWH和市场之间。
  • 集市基于特定领域的需求(与上述相同)。
  • 对于我们来说,我们经常(但并非总是)建立Kimball Star Schema风格的市场,因为最终用户很容易理解这些风格的数据结构。

场合链路模型化DWH进入自己的,有以下几种(使用金博尔术语来表达的问题)

  • 经之际,将有来自用户的要求的查询为什么一个具体的数字具有这个值?'。在传统的Kimball/Inmon中,数据在清理过程中没有办法知道原始值是什么。链接模型在DWH中具有原始数据。
  • 当没有链接多个维度并且需要能够报告全套数据的交易记录时,例如,问一些问题,比如“某家经纪商出售的保险单有多少没有支付索赔交易?”。
  • MDM在类型2 Kimball或Inmon DWH中的应用可能会导致大量类型2更改记录被写入Dimensions,这些记录通常包含所有数据值,因此存在大量数据重复。使用链接模型/数据仓库,新的维度值只会导致在链接表中创建新的类型2链接,该链接表只包含实体表的外键。这在Kimball DWH中通常具有缓慢变化的尺寸和fast changing dimension,这是一个公平的解决方法。
  • 在保险和其他需要能够生产'截至日期'报告的行业中,事实表也会慢慢发生变化,类型2维度跟踪对2型事实记录是一场噩梦。
  • 从发展的角度来看,向大型Kimball维度添加新列需要谨慎完成,考虑回填是重要的,但通过链接模型向实体添加额外的列相对来说并不重要。

在金博尔的方法论中,这些方法总是存在的,但是他们需要一些细心的思考,有时需要跳过一些箍环。

从我们的角度来看,链路建模几乎没有什么坏处。

我与任何营销/生产Kimball/Inmon或Data Vault方法的公司没有关系。

+0

Marcus,我可以在哪里找到关于'Link Modeling'的更多信息? “只有实体和链接”,你是指你将每个中心与卫星合并? – Hugo 2017-08-18 13:58:01

相关问题