0
假设我有一个数据帧:获取星火数据帧中的所有列聚集后
+----+----+---+
| c1|name|qty|
+----+----+---+
|abc1| a| 1|
|abc2| a| 0|
|abc3| b| 3|
|abc4| b| 2|
+----+----+---+
我想只得到最小qty
行,每name
:
+----+----+---+
| c1|name|qty|
+----+----+---+
|abc2| a| 0|
|abc4| b| 2|
+----+----+---+
我这样做:
df1 = df.groupBy('name').agg(sf.min('qty')).select("min(qty)")
df2 = df1.join(df, df1["min(qty)"] == df["qty"]).drop("min(qty)") // df2 is the result
它的工作。我想知道它是否可以改进。你如何改进上述解决方案?
[代码审查](https://codereview.stackexchange.com/)使工作代码更好 – HyperNeutrino