2017-05-11 45 views
3

我在pyspark中有一个数据框。在这个数据框中,我有专门称为id的列。如何查找python数据框中列的最大值

现在我想要找到数据框中id列的maximum值。

我试图像下面

df['id'].max() 

,但得到以下错误

TypeError: 'Column' object is not callable 

请让我知道如何找到在数据帧

maximum值列在@Dadep的回答链接给出了正确答案

+0

你如何创建自己的数据帧?你用'熊猫'吗? – Dadep

+0

这看起来像一个'spark'数据框给我。也许,你需要为你的问题添加一个'spark'或'pyspark'标签。 – Abdou

+2

请尝试分享[mcve]。我能说的最好的是:如果你所说的都是真的,那么它就应该有效。 – MSeifert

回答

0

我从斯卡拉来了,但我不认为这是也适用于python。

val max = df.select(max("id")).first() 

但您首先导入以下:

import org.apache.spark.sql.functions.max 
相关问题