2013-08-07 72 views
0

我在那里绘制(http://db.tt/9SG85XFK)熊猫数据框;带有两个变量的'timestamp'索引(绘制为蓝色和绿色曲线)。在熊猫中使用可变变化来分割时间序列

我想提取那些蓝色曲线变量或多或少是常量(std.variation低于特定值?)的数据框的子集。

因此,对于附加的绘图,它将提取3个不同的子集〜(41000:41170,41180:41315和41320:41580)。

有没有一个干净的方法来做到这一点?我可以通过一个循环来完成,但是......不知道这是正确的。

感谢,

ň

+0

你尝试过什么吗? – Nadh

回答

1

你可能想的rolling_std功能的功能。

指定要检查的标准差区间的宽度(假设100个数据点),选择相应的标准偏差(比方说10),并做到:

import pandas as pd 
s = pd.Series(the way you get your data) 
std = pd.rolling_std(s, 100) 
selected = s[std < 10] 

,你会得到100个数据点周围的标准偏差小于10的所有数据点。