0
我有一个查询。在Pyspark当我们需要基于获得总(SUM)(键,值),我们的查询倒像是:Pyspark - 最大/最小参数
RDD1 = RDD.reduceByKey(lambda x , y: x + y)
地方,当我们需要找到MAX/MIN值(键,值)我们的查询读起来就像
RDD1 = RDD.reduceByKey(lambda x , y: x if x[1] >= y[1] else y)
在不使用x[1]
,Y[1]
,其中作为同样是使用了MAX/MIN为什么我们总结的数据?请澄清疑问。
Rgd的