我在pyspark
中有一个数据框。在这个数据框中,我有专门称为id
的列。如何查找python数据框中列的最大值
现在我想要找到数据框中id
列的maximum
值。
我试图像下面
df['id'].max()
,但得到以下错误
TypeError: 'Column' object is not callable
请让我知道如何找到在数据帧
的
maximum
值列在@Dadep的回答链接给出了正确答案
我在pyspark
中有一个数据框。在这个数据框中,我有专门称为id
的列。如何查找python数据框中列的最大值
现在我想要找到数据框中id
列的maximum
值。
我试图像下面
df['id'].max()
,但得到以下错误
TypeError: 'Column' object is not callable
请让我知道如何找到在数据帧
的
maximum
值列在@Dadep的回答链接给出了正确答案
,如果你使用的是熊猫.max()
将工作:
>>> df2=pd.DataFrame({'A':[1,5,0], 'B':[3, 5, 6]})
>>> df2['A'].max()
5
否则,如果它是一个spark
数据帧:
我从斯卡拉来了,但我不认为这是也适用于python。
val max = df.select(max("id")).first()
但您首先导入以下:
import org.apache.spark.sql.functions.max
你如何创建自己的数据帧?你用'熊猫'吗? – Dadep
这看起来像一个'spark'数据框给我。也许,你需要为你的问题添加一个'spark'或'pyspark'标签。 – Abdou
请尝试分享[mcve]。我能说的最好的是:如果你所说的都是真的,那么它就应该有效。 – MSeifert