2016-09-02 53 views

回答

1

join功能可用于PairRDD对象(请参阅here)。

PairRDD目的是键 - 值对的RDD,例如:RDD[(Int, String)]

通常您从常规RDD使用keyBy函数,它允许用户指定要使用哪个密钥创建PairRDD对象。然后,当您运行join时,它将连接键值相同的元素。

相关问题