2014-10-20 105 views

回答

1

AFAIK没有星火原始的,它会让你通过这样的关键拆分RDD。我们正在使用过滤来实现类似的结果。性能方面,它必须比实际的groupByKey轻很多,因为过滤器不需要洗牌。

val keys = rdd.keys.collect 
val dataByKey = keys.map(key => (key, rdd.filter(_._1 == key)).toMap 

请注意,密钥必须适合驱动程序的内存才能正常工作。

+0

非常感谢您响应我的查询。我会尝试你的建议。 – 2014-10-21 01:24:04

相关问题