在我的ETL过程中,我使用更改数据捕获(CDC)仅发现自上次提取后源表中已更改的行。然后我只对这些行进行转换。问题是,当我有例如我想要加入一个维度的2个表格时,只有其中一个已经改变。例如,我有表国家和城镇如下:使用ETL中的表连接更改数据捕获
国家
ID Name
1 France
城镇:
ID Name Country_ID
1 Lyon 1
现在让我们说一个新的行被添加到城镇表:
ID Name Country_ID
1 Lyon 1
2 Paris 2
国家表格尚未更改,因此这些表格的CDC仅显示了来自Towns表格的行。问题是当我在国家和城镇之间进行连接时,在国家/地区没有变化集合,因此连接会导致空集。
你知道如何解决它吗?当然,可能会有更多困难的情况,涉及3个以上的表格,以及相应的联接。