我正在学习使用pandas resample()函数,但是,下面的代码不会按预期返回任何内容。我每天都重新抽样时间序列。熊猫resample不返回任何东西
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
range = pd.date_range('2015-01-01','2015-12-31',freq='15min')
df = pd.DataFrame(index = range)
df['speed'] = np.random.randint(low=0, high=60, size=len(df.index))
df['distance'] = df['speed'] * 0.25
df['cumulative_distance'] = df.distance.cumsum()
print df.head()
weekly_summary = pd.DataFrame()
weekly_summary['speed'] = df.speed.resample('D').mean()
weekly_summary['distance'] = df.distance.resample('D').sum()
print weekly_summary.head()
输出
speed distance cumulative_distance
2015-01-01 00:00:00 40 10.00 10.00
2015-01-01 00:15:00 6 1.50 11.50
2015-01-01 00:30:00 31 7.75 19.25
2015-01-01 00:45:00 41 10.25 29.50
2015-01-01 01:00:00 59 14.75 44.25
[5 rows x 3 columns]
Empty DataFrame
Columns: [speed, distance]
Index: []
[0 rows x 2 columns]
这个工作对我来说,你使用的是什么版本的熊猫吗? Mine是0.19.1,也许令人困惑的是,你最初创建一个空的df,然后分配一个新的列,这可能是因为它没有扩大df – EdChum
0.13.1是我的版本,这可能会在旧版本中失败。 – daydayup
@daydayup你可能想要更新熊猫的许多东西,在几年的时间内改变:) – miradulo