2016-04-14 92 views
1

我有我试图找到所有的名字过滤基于另一个数据帧中的星火

val users = df.select("name").distinct 
    val final_status = users.map(t => 
    { 
    val _name = t.getString(0) 
    val record = df.where(col("name") === _name) 
    val lastRecord = userRecord.sort(desc("date")).first 
    lastRecord 
    }) 

这工作与去年地位列

date: timestamp 
status : String 
name : String 

一个数据帧DF一个数据帧阵列,但它与火花数据帧投掷java.lang.NullPointerException

更新1:使用removeDuplicates

df.sort(desc("date")).removeDuplicates("name") 

这是一个很好的解决方案吗?

+0

工作)这已经覆盖上多次因此而不能正常工作b)当removeDuplicates的来源是什么?看起来不像现有的方法。 – zero323

回答

相关问题