2016-05-16 82 views

回答

4

在我pyspark壳,下面的代码片段正在努力:

from pyspark.sql.functions import * 
myCol = col("`id.orig_h`")  
result = df.groupBy(myCol).agg(...) 

myCol = df["`id.orig_h`"] 
result = df.groupBy(myCol).agg(...) 

我希望它能帮助。

+0

谢谢@Daniel de Paula的回答。你能确认使用''groupby(“'id.orig_h'”)''不起作用吗? –

+0

@HananShteingart,对于我来说,下面的代码有效:'df.groupBy(“\'id.orig_h \'”)。agg(...)' –

+0

对我来说它并不是。你可以请添加更多的列从ID开始。 ?我使用pyspark 1.6 –