1
我需要在PDI(壶)中GroupBy和MergeJoin。两者都使用与密钥相同的字段。我是否需要在合并之前进行排序
我无法在任何地方确认GroupBy数据的排序后。
在情况下,我需要知道,如果这将是正确的: SORT> GROUPBY> SORT> MERGEJOIN 或 SORT> GROUPBY> MERGEJOIN
有人能告诉我什么是正确的,为什么?
非常感谢。
我需要在PDI(壶)中GroupBy和MergeJoin。两者都使用与密钥相同的字段。我是否需要在合并之前进行排序
我无法在任何地方确认GroupBy数据的排序后。
在情况下,我需要知道,如果这将是正确的: SORT> GROUPBY> SORT> MERGEJOIN 或 SORT> GROUPBY> MERGEJOIN
有人能告诉我什么是正确的,为什么?
非常感谢。
您需要根据您要分组或加入的密钥对分组依据和合并加入进行排序。关于退出的数据将具有与以前相同的顺序,因此,如果您根据相同的键进行分组然后合并,则不需要Group by和Merge Join之间的排序。
但是,如果键改变了,
谢谢你nsousa。 –