1
GROUPBY我有一个时间序列是这样大熊猫时间序列使用TimeGrouper
Time Demand
Date
2014-01-01 0:00 2899.0
2014-01-01 0:15 2869.0
2014-01-01 0:30 2827.0
2014-01-01 0:45 2787.0
2014-01-01 1:00 2724.0
2014-01-01 1:15 2687.0
2014-01-01 1:30 2596.0
2014-01-01 1:45 2543.0
2014-01-01 2:00 2483.0
其为以15个分钟为增量。我想每天每个小时的平均时间。所以我尝试了这样的df.groupby(pd.TimeGrouper(freq='H')).mean()
。它没有完全正确,因为它主要返回NaNs
。
现在我的数据集全年都有这样的数据,我想计算所有月份所有小时的平均值,这样我有24个点,但平均值是一年中的所有小时数,例如第一个小时就是所有月份的第一个小时的平均值。预期产出将是
2014 00:00:00 2884.0
2014 01:00:00 2807.0
2014 02:00:00 2705.5
2014 03:00:00 2569.5
..........
2014 23:00:00 2557.5
我该如何实现这一目标?
修改后的'df.index' :-)的很好的解决方案。对于聚合,你也可以使用'df.resample(“H”)。mean()'而不需要groupby,这样做更容易一些。 – pansen
不错的解决方案。现在我的数据集全年都有这样的数据,我想计算所有月份所有小时的平均值,这样我有24点,但平均值是一年中的所有小时数,例如第一个小时就能获得所有月份第一个小时的资金。我怎样才能做到这一点? –
你可以添加一些样本与期望的输出?因为我不确定我是否了解你。谢谢。 – jezrael