我希望能够在数据框上使用groupby和resample来获取每年一次的字段计数。比方说,我有一个数据帧结构为这样:在熊猫中使用Groupby对象和重采样
df = pd.DataFrame({'year': {0: '2017', 1: '2018', 2: '2016', 3: '2018'}, 'month': {0: '1', 1: '2', 2: '3', 3: '4'}, 'day': {0: '1', 1: '1', 2: '1', 3: '3'}})
df['Date']=pd.to_datetime(df)
#Sorry there is probably and easier way to set up the df
df['B']=[1, 2, 3, 1]
df['C']=[2,3,4, 1]
df=df.ix[:, ['Date', 'B', 'C']]
df.groupby('B').resample('A', on='Date')
如何按列B获得的代码的最后一行到组,仍然可以通过年份或月份,等重新取样?最后,我正在寻找按B分组的每年C计数。如果可能,我希望在过程中保持我的索引。谢谢。
公平点。只是所以我知道,没有办法使用pd.resample函数?谢谢。 –
@TylerRussell,请参阅编辑以使用群组重复采样 – Vaishali
这是一种有用的方式来看待这两种方式。感谢你的帮助。 –