0
dput(d)
structure(list(TimeStamp = structure(c(1459569739, 1459569739,
1459569739, 1459569739, 1459569739, 1459569739), class = c("POSIXct",
"POSIXt"), tzone = ""), Status = structure(c(1L, 2L, 1L, 1L,
1L, 1L), .Label = c("get", "send"), class = "factor")), .Names = c("TimeStamp",
"Status"), row.names = c(NA, 6L), class = "data.frame")
这是大数据集的一个子集。我需要每5分钟计算一次状态栏。状态可以发送或获取。我需要每5分钟计算一次状态。您如何总结每5分钟数据帧中的因素
我已经试过这样的事情:
agg<- aggregate(data["Status"], list(fiveMin=cut(data$TimeStamp, "5 mins")),sum)
它抱怨不能够指望的因素。有没有其他方法?
怎么样你打算总结诸如“获取”和“发送”的值? “获得”+“发送”多少钱?试试'aggregate(d [“Status”],list(fiveMin = cut(d $ TimeStamp,“5 mins”)),length)'也许 –
@DavidArenburg,我需要计算得到并发送不同 – user1471980
试试'library data.table); dcast(setDT(d),cut(TimeStamp,“5分钟”)〜状态,长度)' –