2017-04-13 70 views
1

来自wiki,数据沿袭和数据来源之间有什么区别?

数据沿袭被定义为一个数据生命周期,包括数据的起源以及它随时间推移的位置。它描述了数据在不同流程中发生的情况。它有助于提供对分析管道的可视性,并将追踪错误简化为源头。

数据出处记录影响感兴趣数据的输入,实体,系统和过程,实际上提供了数据及其起源的历史记录。

看来这两个概念都在谈论数据的来源,但我仍然对这些差异感到困惑。两个概念都一样吗?如果他们不同,有人可以分享一个例子吗?

感谢,

+1

他们很可能是同一件事。我从来没有听说过数据的来源。在阅读了关于数据起源的信息之后,它似乎更多地关注追踪对文档的影响而不是任何单一数据,而数据沿袭更多地涉及数据仓库,其中记录中的特定列具有明确的源和转换列表到达那里,例如解释源系统(总账)和任何计算(此账户+账户)。 –

回答

3

根据我们的经验,数据出处包括系统针对企业用户的唯一的高级视图,这样他们就可以粗略地浏览,他们的数据从何而来。它由各种建模工具或简单的自定义表格和图表提供。 数据沿袭是一个更具体的术语,包括两个方面 - 商业(数据)沿袭和技术(数据)沿袭。业务沿袭图片数据在业务术语层面流动,它由像Collibra,Alation和其他许多解决方案提供。技术数据沿袭是根据实际的技术元数据创建的,并跟踪最底层的数据流 - 实际的表格,脚本和报表。技术数据沿袭由诸如MANTA或Informatica Metadata Manager等解决方案提供。

相关问题