data-warehouse

    1热度

    1回答

    来自wiki, 数据沿袭被定义为一个数据生命周期,包括数据的起源以及它随时间推移的位置。它描述了数据在不同流程中发生的情况。它有助于提供对分析管道的可视性,并将追踪错误简化为源头。 数据出处记录影响感兴趣数据的输入,实体,系统和过程,实际上提供了数据及其起源的历史记录。 看来这两个概念都在谈论数据的来源,但我仍然对这些差异感到困惑。两个概念都一样吗?如果他们不同,有人可以分享一个例子吗? 感谢,

    3热度

    2回答

    所以我试图建立一个服务的数据仓库,其中每个客户都有自己的数据库和独特的架构。我该如何设置仓库,以便每个客户都自动设置自己的语义层/关系模型(因为我们(集中)不知道每个数据库中的内容)以便每个客户都可以轻松报告他们的数据?有没有我们可以遵循的自动过程?我错过了什么吗?

    0热度

    1回答

    我们正在慢慢改变DWH中的维度。类型1,类型2,类型3等。这使我们能够跟踪维度表中的更改。但是,跟踪事实表中变化的方式是什么?

    1热度

    1回答

    在星型模式的维度中为37种不同属性/“检查点”(可以分级为通过/失败/不适用)建模的最佳方式是什么?事实表中的每一行都是针对相关检查点进行分级的通信? TL; DR: 我已经开发了星型架构模型,其中在事实表中的每一行是一个单一的通信。这些通信经历了一系列分级的“检查”(例如“张贴时间”,“正确的电子邮件主题”,“XYZ内容正确复制”等),并且每个检查可以被评为“合格”,“错过”或“不适用”。 不同

    0热度

    1回答

    在我的教材中,它说数据仓库中的数据只在一段时间内有效,换句话说,它被认为是时间依赖的,但根据数据仓库的四个特点,非易失性属性表示一次数据已在数据仓库内输入,不能随意更改。 那么有没有数据仓库的其他任何涉及数据仓库时间依赖的属性?

    0热度

    1回答

    我们的组织结构为组(A,B,C ...)和单元(A1,B2)等等) 层次结构作为条款存储在主数据数据库中,包含有效日期和附加属性。这样我们知道B2单位是“审计亚洲”,直到上个月才是“法律事务”。然而,像合同管理工具这样的系统只是使用代码:例如“合同123456由B2单元管理”;我的问题是:我们应该怎么知道哪个 B2被引用? 至于我可以看到有两种方法可以做到这一点: 每一个组织实体都有一个唯一的ID

    0热度

    1回答

    首先,我试图通过说明它们与星型图式和雪花图式区分开来。但是在尝试对表格进行规范化以创建雪花模式时遇到问题。 所附的图像是星型模式 enter image description here 我试图创造dimcustomer另一个维度表,但我不知道我能说出桌子上。请,任何帮助,将不胜感激。 雪花架构 enter image description here

    0热度

    3回答

    在报告中,我有下从事实表联接: 加入... LEFT JOIN DimState AS s ON s.StateCode = l.Province AND l.Locale LIKE (s.CountryCode + '%') 的更多信息: 事实表中有59567773行 L.Province可以匹配DimState一个StateCode :42,346,471行71% L.Province无

    -2热度

    1回答

    当设计一个用于分析诊所进度计划过程的维度模型时,是预约粮食在事实表中吗? 如果约会是粮食,如何计算预订属性,如超额预订属性?

    0热度

    2回答

    有关维度建模和角色扮演的问题。 我们有一个地址维度是“角色扮演”。我们收到来自不同来源的地址,包括CRM系统。地址也可以是不同的类型,例如公司地址,个人等。因此,从角色扮演地址维度中,单个地址可以被标记为公司和地址的地址以用不同的事实来计费。 有不同的事实表,他们有不同的密钥,将保存地址数据。 Fact_Sales将具有诸如Customer_Address_Key,Company_Head_Off