比方说,我有一个时间戳数据框和当时销售的相应门票数量。使用滚动时间间隔来计算R和dplyr中的行
Timestamp ticket_count
(time) (int)
1 2016-01-01 05:30:00 1
2 2016-01-01 05:32:00 1
3 2016-01-01 05:38:00 1
4 2016-01-01 05:46:00 1
5 2016-01-01 05:47:00 1
6 2016-01-01 06:07:00 1
7 2016-01-01 06:13:00 2
8 2016-01-01 06:21:00 1
9 2016-01-01 06:22:00 1
10 2016-01-01 06:25:00 1
我想知道如何计算在所有门票的特定时间范围内出售的门票数量。例如,我想计算所有票后15分钟内售出的票数。在这种情况下,第一行将有三张票,第二行将有四张票,等等。
理想情况下,我正在寻找一个dplyr解决方案,因为我想为具有group_by()
函数的多个商店。但是,我在确定如何保存每个给定行的Timestamp时遇到一些问题,同时通过dplyr语法搜索所有时间戳。
不完全。这只是第二行的正确答案。每行所需的窗口是不同的。所以对于第一行,我想知道5:30到5:45之间的票数,第二行是5:32和5:47之间的票数,5:38和5之间的第三行:53等,这是否有意义? – dmartin