我使用SSIS2012
。我在我的数据仓库中创建了三个模式(STG
,TRSF
,DW
)。我们是否应该在我们的解决方案中的几个项目之间分开ssis包?
STG模式用于登台表。我所有的源文件都是CSV文件。我将数据从我的源传输到stg模式中的每个表。我有一个单独的包为每个表(例如:如果我有20个CSV文件,我将有20个包,我将在STG架构中填充20个表)
之后,我将stg
架构转移到trsf
架构。在这些过程中,我有我的事业。我会查找FK,其他业务规则将应用于此级别。如果我在stg
模式中有20个表,我将拥有20个包,并且我将在trsf
模式中填充20个表。
第三步我将数据从trsf
模式转移到dw
模式。这里我也有20个包。
最后,我将有20个包,用于清理stg
架构中的表。
我为csv文件和dw
模式中的表之间的每个转换创建了4个包。
我想知道为每个步骤创建4个独立的项目是否好主意?因为现在,我在一个项目中有80个软件包,并且它可以成长得更多。
个人而言,我会继续我的包在一起,但如果它导致的问题对你来说,它们分离出来。 – Rich
这里最重要的是组织。只要你知道你的软件包做什么,并且可以控制它们执行的顺序;我会说其余的并不重要。无关;如果每个模式都有20个表,那么这是否意味着最终的dw表看起来很像原始数据?如果你没有[转换你的数据](https://en.wikipedia.org/wiki/Data_transformation),trsf和dw模式是不是带来了什么? –
@ destination-data:我很感谢你的回答。我只是在谈论维度表。我对事实表进行了改造。我有几个SQL作业。这些是按顺序执行4个包的4个步骤。 (Staging/TRSF/DW/Cleanning) –