这真是我猜想的两个问题。我正在尝试使用data.table包来汇总大型数据集。假设我最初的大数据集是df1,不幸的是df1有50列(y0 ... y49),我想要3个字段的总和(segmentfield1,segmentfield2,segmentfield3)。有没有比输入每个y0 ... y49列更简单的方法呢?与此相关的是,data.table中是否有一个通用的na.rm = T,而不是每个和都输入?用R中的data.table求和很多列,删除NA
dt1 <- data.table(df1)
setkey(dt1, segmentfield1, segmentfield2, segmentfield3)
dt2 <- dt1[,list(y0=sum(y0,na.rm=T), y1=sum(y1,na.rm=T), y2=sum(y2,na.rm=T), ...
y49=sum(y49,na.rm=T)),
by=list(segmentfield1, segmentfield2, segmentfield3)]
@rcs,并不完全是重复的,但类似 –