1
我有我试图找到所有的名字过滤基于另一个数据帧中的星火
val users = df.select("name").distinct
val final_status = users.map(t =>
{
val _name = t.getString(0)
val record = df.where(col("name") === _name)
val lastRecord = userRecord.sort(desc("date")).first
lastRecord
})
这工作与去年地位列
date: timestamp
status : String
name : String
一个数据帧DF一个数据帧阵列,但它与火花数据帧投掷java.lang.NullPointerException
更新1:使用removeDuplicates
df.sort(desc("date")).removeDuplicates("name")
这是一个很好的解决方案吗?
工作)这已经覆盖上多次因此而不能正常工作b)当removeDuplicates的来源是什么?看起来不像现有的方法。 – zero323