我正在使用Talend来填充数据仓库。我的工作是将客户数据写入维度表并将事务数据写入事实表。事实表上的代理键(p_key)是自动递增的。当我插入新客户时,我需要我的事实表来反映相关客户的ID。ETL操作 - 返回主键
正如我所提到的,我的p_key是auto auto_incrementing,所以我不能只为p_key插入任意值。
有关如何将行插入我的维度表并仍检索要在我的事实记录中引用的主键的想法?
更多信息:
如果传入的数据未规范化会怎么样?比如我有一个具有以下数据为csv:
order # date total customer# first_name last_name
111 1/2/2010 500 101 John Smith
222 1/3/2010 600 101 John Smith
很显然,我希望客户信息出现在维表和事实表的交易数据:
dimension
101 john smith
fact
111 1/3/2010
222 1/3/2010
正如你提到,维表的关键是自动递增。事实表需要引用这个键。您如何设计etl作业,以便插入后返回代理键?
此外,如果客户数据被删除(如上),您将如何处理密钥?
什么是您的仓库使用的RDBMS? –