我有一个熊猫数据帧,看起来像这样:熊猫 - GROUPBY连续日期时间段
KEY START END VALUE
0 A 2017-01-01 2017-01-16 2.1
1 B 2017-01-01 2017-01-23 4.3
2 B 2017-01-23 2017-02-10 1.7
3 A 2017-01-28 2017-02-02 4.2
4 A 2017-02-02 2017-03-01 0.8
我想groupby
上KEY
和sum
上VALUE
但仅限于时间连续句。因为在该时间段的空隙
A
KEY START END VALUE
0 A 2017-01-01 2017-01-16 2.1
1 A 2017-01-28 2017-03-01 5.0
2 B 2017-01-01 2017-02-10 6.0
有二组:比如在上面的例子中,我想获得。 我想避免循环,因为数据帧有数千万行。
谢谢。但是,这一次只汇集两行。任何想法如果我有与原始问题中描述的相同的数据框,再加上'START'= 2017-03-01和'2017-03-31'为'END'的附加行,我可以如何修改您的解决方案?在这种情况下,从2017-01-28到2017-03-31有一个完全连续的时期,3行应该汇总在一起。 – Prikers
不是那么容易,我尝试找到解决方案,但如果需要更快,您能创建新问题吗? – jezrael