- 编辑我注意到我输入的时间不是我的意图。我将12点后的时间转换为24小时制。但是,unutbu的答案应该很清楚。熊猫组按时间与指定的开始时间
- 2nd Edit。我改变了数据以作出更好的例子。
以下是按日期索引的时间序列。我想从start_datetime开始聚合,并根据下面的timedelta(9.5小时= 34200秒)继续聚合。
def main():
# start_datetime = datetime.datetime(2013, 1, 1, 8)
# end_datetime = datetime.datetime(2013, 1, 1, 5, 30)
s = pd.Series(
np.arange(2, 10),
pd.to_datetime([
'20130101 7:34:04', '20130101 8:34:08', '20130101 10:34:08',
'20130101 12:34:15', '20130101 13:34:28', '20130101 12:34:54',
'20130101 14:34:55', '20130101 17:29:12']))
print(s)
bar_size = datetime.timedelta(seconds=60*60*9.5)
time_group = pd.Grouper(
freq=pd.Timedelta(bar_size), closed='left', label='right')
foobar = s.groupby(time_group).agg(np.sum)
print(foobar)
if __name__ == "__main__":
main()
运行上面的代码将输出以下内容:
2013-01-01 09:30:00 5
2013-01-01 19:00:00 39
Freq: 570T, dtype: int64
大熊猫内部决定开始从午夜分组上午8:00代替。我无法找到强制数据框在上午8:00开始分组的方式。有没有人有使用熊猫功能的解决方案?
伟大的答案!谢谢! – itzjustricky