以下Iterable
可以是大小one
,two
或(最多)three
。如何基于另一个排序元组排序元组
org.apache.spark.rdd.RDD[Iterable[(String, String, String, String, Long)]] = MappedRDD[17] at map at <console>:75
每个元组的第二元件可以具有任何下列值:A
,B
,C
。每个值都可以出现(最多)一次。
我想要做的是那种基于它们按下列顺序(B
,A
,C
),然后创建通过连接第三名的元素的字符串。如果缺少相应的tag
,则将其与空格连接:``。例如:
这样的:
CompactBuffer((blah,A,val1,blah,blah), (blah,B,val2,blah,blah), (blah,C,val3,blah,blah))
应导致:
val2,val1,val3
这样的:
CompactBuffer((blah,A,val1,blah,blah), (blah,C,val3,blah,blah))
应导致:
,val1,val3
这样的:
CompactBuffer((blah,A,val1,blah,blah), (blah,B,val2,blah,blah))
应导致:
val2,val1,
这样的:
CompactBuffer((blah,B,val2,blah,blah))
应导致:
val2,,
等等等等。