只留下最后一个事件名字我有一个表(输入):为每个用户(R语言)
user_id timestamp progression
1 Rob 22223333 Level1
2 Mike 33334444 Level2
3 Rob 55558888 Level3
4 Mike 44447777 Level7
我需要与去年progression
取决于timestamp
添加列。
所需的输出:
user_id timestamp progression lastProgression
1 Rob 22223333 Level1 Level3
2 Mike 33334444 Level2 Level7
3 Rob 55558888 Level3 Level3
4 Mike 44447777 Level7 Level7
有可能是没有必要的外部包在这里,但我会用'library(data.table); setDT(df)[unique(df [order(-timestamp)],by =“user_id”),lastProgression:= i.progression,on =“user_id”]'效率 –
或'setDT(df)[,lastProgression: =进展[which.max(timestamp)],by = user_id]' –