我一直在研究Amazon的Redshift数据库,以此作为我们数据仓库的未来替代品。我的经验一直在使用尺寸建模和Ralph Kimball的方法,所以看到Redshift不支持自动递增列的串行数据类型等功能有点奇怪。Redshift中的维度建模和ETL
有,但是,从AWS大数据博客有关如何优化红移为星型架构这个最近的一篇博客: https://blogs.aws.amazon.com/bigdata/post/Tx1WZP38ERPGK5K/Optimizing-for-Star-Schemas-and-Interleaved-Sorting-on-Amazon-Redshift
我的问题是关于什么是加载一个明星的最佳实践Redshift中的模式?我无法在Redshift的任何文档中找到这个答案。
我倾向于将我的文件从S3导入到登台表中,然后使用SQL在插入目标表之前执行查找和生成替代键等转换。
这是别人目前在做什么?有没有一种ETL工具可以让这个工作变得更容易?
谢谢,这就是我很好奇的。我想最好的是通过Redshift中的ETL完成所有的ETL逻辑。 – njkroes