0
我正在写一个程序,我有一个RDD [String]和一个CassandraTableScanRDD,我想在它们之间做一个左连接。加入CassandraTableScanRDD [CassandraRow]与RDD [String]
这可能吗?从我在网上看到的连接只是在CassandraTableScanRDD之间进行。
我正在写一个程序,我有一个RDD [String]和一个CassandraTableScanRDD,我想在它们之间做一个左连接。加入CassandraTableScanRDD [CassandraRow]与RDD [String]
这可能吗?从我在网上看到的连接只是在CassandraTableScanRDD之间进行。
join
功能可用于PairRDD
对象(请参阅here)。
甲PairRDD
目的是键 - 值对的RDD,例如:RDD[(Int, String)]
通常您从常规RDD
使用keyBy
函数,它允许用户指定要使用哪个密钥创建PairRDD
对象。然后,当您运行join
时,它将连接键值相同的元素。