-1
A
回答
1
我假设RDD到要应用keyBy
是阵列的RDD。然后您可以简单地将keyBy
方法与映射到前两列的函数进行比较:
val rdd=sc.parallelize(List(
Array(1,2,3),
Array(1,2,4),
Array(2,3,1),
Array(2,3,2)
))
val keyedRdd=rdd.keyBy{a=>(a(0),a(1))}
keyedRdd.take(4)
//Array[((Int, Int), Array[Int])] = Array(
// ((1,2),Array(1, 2, 3)),
// ((1,2),Array(1, 2, 4)),
// ((2,3),Array(2, 3, 1)),
// ((2,3),Array(2, 3, 2))
//)
相关问题
- 1. 将两列加入新列
- 2. Laravel锋关系keyBy()
- 3. 将对象传递给Spark
- 4. 管内衬/在pyspark的RDD的keyby的keyby(火花)
- 5. Spark列 - 写入控制台
- 6. MySQL - 将两行加入两列
- 7. Ramdajs keyBy相当于lodash
- 8. Flink keyBy摸索问题
- 9. 将Tableau csv导入Spark
- 10. Spark将数据插入Cassandra
- 11. Spark SQL read.json读取JSON输入两次
- 12. 加入两个数据集spark scala
- 13. 在Spark中加入两个HDFS文件
- 14. 车削字典传入两个阵列
- 15. 如何在Spark中将两个数组并入数组中?
- 16. 将lambdas传入方法来比较两个列表的成员
- 17. Spark DataFrame将行添加列
- 18. Spark:根据两列计数事件
- 19. 如何将两个参数传入EventToCommand
- 20. Spark将大文件读入输入流
- 21. Spark:将两个字段一起计算
- 22. 将可空列作为参数传递给Spark SQL UDF
- 23. 通过spark-submit将其他罐子传递给Spark
- 24. 将案例类传递给Spark UDF
- 25. Spark:如何将PartialFunction传递给DStream?
- 26. Spark:将json流式传输到parquet
- 27. 将配置传递给Spark Job
- 28. 将文件上传到Spark Java
- 29. 当通过列列表映射时返回两列Spark SQL Scala
- 30. 星火CassandraTableScanRDD KeyBy不持有的所有列