2015-11-10 28 views
0

这是商业智能,ETL数据集成和数据仓库环境中的术语问题。什么是主数据?

我总是了解到,数据仓库具有交易“事实表”,它引用“维表”。但是,其他一些人正在使用术语“主数据”。这在ETL和数据仓库的上下文中有不同的含义,它是否等同于“维度表”?

+0

我将使用术语问的人:“你说的‘主数据’意味着” –

+0

我认为他们滥用术语“主数据”来描述所有的维表。我只是想坚持下去。通用语言的关键在于,当其他ETL专家或开发人员加入团队时,如果传统术语被滥用,将会产生混淆。 – user45867

回答

0

主数据是跨企业共享并由多个应用程序和系统存储和使用的关键业务数据。主数据的典型候选者是客户,位置和产品。

使用主数据的主要驱动因素是整合和重用的能力。以前面的例子来说,客户数据很可能在多个应用程序之间共享。在适当的主数据管理下,这些数据将在这些应用程序中保持一致,并减少多个表的冗余。

数据仓库中主数据与维度表之间的主要区别在于各自的目的。维度表提供有关事实的信息,而主数据则为整个业务提供信息。

请记住,许多维度表也可能是主数据的候选者。了解更多关于主数据管理(MDM)位置:https://msdn.microsoft.com/en-us/library/bb190163.aspx

+0

我想我现在开始明白了一点。只是想指出,尽管我最初的问题已经被大量编辑,甚至可以改变其含义。另外,在发布之前,我已经阅读了维基百科的主数据条目,但是呃。无论如何,也许一个具体的例子是为了。以一个典型的规范化数据库。你有“电话线”ID的电话。这些ID链接到一个表格 - 显示电话号码,以及编号,名称,创建日期等。对我来说,这是一个DIMENSIONAL表。它绝不是“主数据”。 – user45867

+0

如果我要正确理解,术语MASTER DATA不是关于表格的结构,因为它涉及到规范化的数据库。更多的是关于可重用性,通用性,“单一事实点”和“一致的维度”,而且大多数时候恰好是一个维度表。客户信息就是一个很好的例子。您可能有多个应用程序链接到客户端ID,但拼写名称不同,地址等等,因此使用MASTER表来符合这些维度。我认为我面临的问题是同事们将每个维度表都描述为主,这是一个概念性错误。 – user45867

+0

@ user45867完全不是所有的维度表都是主数据。然而,我在答案中提供的定义不是来自维基百科,而是我写的,我认为会有所帮助的。我很抱歉在编辑中丢失了任何信息。 –