我有一个Spark RDD,其条目我想以有组织的方式进行排序。假设条目是一个包含3个元素(name,phonenumber,timestamp)
的元组。我想首先根据phonenumber
的值对条目进行排序,然后根据timestamp
的值对条目进行排序,同时尊重并不改变基于phonenumber
完成的排序。 (所以timestamp
只根据phonenumber
排序重新排列)。有Spark功能来做到这一点?如何使用两个功能同时对RDD条目进行排序?
(我用的Spark 2.X使用Scala)