如何才能对以下示例数据框进行子集化,以仅返回最早发生的一个 观察[即分(年)]每个ID?子集R数据框或有关重复变量的值
id <- c("A", "A", "C", "D", "E", "F")
year <- c(2000, 2001, 2001, 2002, 2003, 2004)
qty <- c(100, 300, 100, 200, 100, 500)
df=data.frame(year, qty, id)
在上面的例子中有在2000年和2001年在重复的ID的情况下,两个意见为“A”的ID,我想该子集的数据帧仅包括第一次出现(即在2000年)重复的id的观察。
df2 = subset(df, ???)
这就是我试图返回:
df2
year qty id
2000 100 A
2001 100 C
2002 200 D
2003 100 E
2004 500 F
任何援助将不胜感激。
非常直观的解决方案。非常感谢你。 – MikeTP