包含日期,买入价值和卖出价值的表格。我想要统计每天的购买量和销售量,以及购买和销售的总数。我在data.table中发现这有点棘手。R data.table中的分组计数汇总
date buy sell
2011-01-01 1 0
2011-01-02 0 0
2011-01-03 0 2
2011-01-04 3 0
2011-01-05 0 0
2011-01-06 0 0
2011-01-01 0 0
2011-01-02 0 1
2011-01-03 4 0
2011-01-04 0 0
2011-01-05 0 0
2011-01-06 0 0
2011-01-01 0 0
2011-01-02 0 8
2011-01-03 2 0
2011-01-04 0 0
2011-01-05 0 0
2011-01-06 0 5
以上data.table可以使用下面的代码来创建:
DT = data.table(
date=rep(as.Date('2011-01-01')+0:5,3) ,
buy=c(1,0,0,3,0,0,0,0,4,0,0,0,0,0,2,0,0,0),
sell=c(0,0,2,0,0,0,0,1,0,0,0,0,0,8,0,0,0,5));
我想要什么,结果是:
date total_buys total_sells
2011-01-01 1 0
2011-01-02 0 2
and so on
而且我也想知道购买和销售总数:
total_buys total_sells
4 4
我曾尝试:
length(DT[sell > 0 | buy > 0])
> 3
这是一个奇怪的答案(想知道为什么)
总和增加了购买价值 - 我期待指望他们。总购买量和总销售量各有4个。 – user1480926
@ user1480926更新了答案 –
谢谢杰克你介意解释这是如何工作的?这是一个非常简洁的方法来做到这一点的荣誉。 – user1480926