如何使用Pentaho处理在Amazon Redshift中缓慢变化的维度？

由于Amazon Redshift已针对阅读而非书写进行了优化，因此如何使用ETL工具管理渐变维度过程，在我的案例中是Pentaho数据集成？如何使用Pentaho处理在Amazon Redshift中缓慢变化的维度？

由于ETL工具会逐行更新/插入（维度查找/更新），所以性能会非常低。

有没有人已经通过这个问题？

实际上将更改/插入的维数行的百分比是多少？如果百分比很小（<20％左右），“尺寸查找/更新”步骤可能会很好。 –

我正面临同样的怀疑。让PDI维护本地MySQL实例中的维度表可能会更快，然后每次都在Redshift中执行截断和完全加载。你是怎么做到的？ – GGGforce

在红移更新缓慢，因为更新是在事务执行的操作的顺序：要更新到一个临时表

删除这些行

更新

所有必须在节点间进行协调。

更新单个行可能需要更新1000行。更糟的是，由于更新时间太长且需要写入锁定，因此它们会长时间阻止查询，从而严重影响整个系统的性能。

有3种方式，使其更快（全部来自经验）：

2016-05-23 02:29:26 denismo

回答