2014-07-22 40 views
1

我需要在PDI(壶)中GroupBy和MergeJoin。两者都使用与密钥相同的字段。我是否需要在合并之前进行排序

我无法在任何地方确认GroupBy数据的排序后。

在情况下,我需要知道,如果这将是正确的: SORT> GROUPBY> SORT> MERGEJOIN 或 SORT> GROUPBY> MERGEJOIN

有人能告诉我什么是正确的,为什么?

非常感谢。

回答

1

您需要根据您要分组或加入的密钥对分组依据和合并加入进行排序。关于退出的数据将具有与以前相同的顺序,因此,如果您根据相同的键进行分组然后合并,则不需要Group by和Merge Join之间的排序。

但是,如果键改变了,

+0

谢谢你nsousa。 –

相关问题