2
我有两列感兴趣的时间戳数据:'标签'和一个计数。我想创建一个时间序列,每个标签的总和,比如说一天。我可以使用resample
来实现吗?用熊猫重新取样'整齐'数据框
具体的例子:
import pandas as pd
import numpy as np
from itertools import cycle
idx = pd.date_range('2016-01-01', '2016-01-07', freq='H')
n = np.random.randint(10, size=24*6+1)
lst = [(l,c) for l,c in zip(cycle(['foo', 'bar']), n)]
df = pd.DataFrame(lst, index=idx, columns=['label', 'n'])
df.resample(???).sum()
在这个例子中,目标数据帧应该包含一个时间索引并含有每时间间隔的总计数两列(foo
和bar
)。
我做不期望成为可能用'groupby'链接'resample',非常强大。作为一个便笺,我想出了第三种方式,使用TimeGrouper:'df.groupby([pd.TimeGrouper('W'),'label'])'。 –