1
groupByKey给了我RDD [键,值]我找不到任何方法将其转换为Map [key,RDD [values]]。 谢谢。Apache spark:我们如何将RDD [v]分成Map [k,RDD [v]]?
SV
groupByKey给了我RDD [键,值]我找不到任何方法将其转换为Map [key,RDD [values]]。 谢谢。Apache spark:我们如何将RDD [v]分成Map [k,RDD [v]]?
SV
AFAIK没有星火原始的,它会让你通过这样的关键拆分RDD。我们正在使用过滤来实现类似的结果。性能方面,它必须比实际的groupByKey
轻很多,因为过滤器不需要洗牌。
val keys = rdd.keys.collect
val dataByKey = keys.map(key => (key, rdd.filter(_._1 == key)).toMap
请注意,密钥必须适合驱动程序的内存才能正常工作。
非常感谢您响应我的查询。我会尝试你的建议。 – 2014-10-21 01:24:04
[如何将RDD拆分为两个或多个RDD?](http://stackoverflow.com/questions/32970709/how-to-split-a-rdd-into-two-or-more- rdds) – 2016-11-03 15:12:13