我正在用交易数据进行数据分析。我想用熊猫来检查交易者活跃的时间。熊猫:将重采样与groupby结合并计算时差
特别是,我尝试提取的差异在每个交易者对每一天的每一个第一次交易的日期之间分钟,并累积按月
的数据是这样的:
Timestamp (Datetime) | Buyer | Volume
--------------------------------------
2012-01-01 09:00:00 | John | 10
2012-01-01 10:00:00 | Mark | 10
2012-01-01 16:00:00 | Mark | 10
2012-01-01 11:00:00 | Kevin | 10
2012-02-01 10:00:00 | Mark | 10
2012-02-01 09:00:00 | John | 10
2012-02-01 17:00:00 | Mark | 10
现在我使用重采样来检索每天的第一笔交易。但是,我想也由买方将其分组以计算其交易日期的差异。像这样
Timestamp (Datetime) | Buyer | Volume
--------------------------------------
2012-01-01 09:00:00 | John | 10
2012-01-01 10:00:00 | Mark | 10
2012-01-01 11:00:00 | Kevin | 10
2012-01-02 10:00:00 | Mark | 10
2012-01-02 09:00:00 | John | 10
总的来说,我期待计算每个交易者每日第一笔交易之间的分钟差异。
更新
例如,在约翰对2012-01-01的情况下:距离= 60(DIFF约翰唛)+ 120(DIFF约翰 - 凯文)= 180
我如果有人有一个想法如何做到这一点,将高度赞赏。
谢谢
你能添加一些预期的输出吗? (例如,为你的例子手动创建) – Jeff 2013-04-30 22:49:02