2017-10-11 22 views
0

我希望计算只有在值发生变化时记录的时间序列数据集的平均值和标准偏差。数据集记录的平均/标准计算值的更改仅为

时间序列的间隔为1秒,如果生成每个更改之间的缺失值,则存在数据集膨胀的风险。数据组类型的

实施例:[时代,值]

[[152345235, 3], [152345335, 12], [152345835, 8]] 

我们正在使用的清洁Python和聚集的数据。稀疏矩阵是不够的,因为它基于忽略不存在的0值。在研究方面,没有任何证据表明可以很快解决这个问题。

我的问题是,有没有人遇到类似的问题,如果是的话,用什么技术来解决。

+1

意思就是sum()/ n,你应该知道n是什么。 std有点难度,但同样的基本方法将起作用。你只需要(0-均值)*(n-x)其中x是非零数。 – JohnE

回答

1

我会通过epoch订购清单,然后将value乘以epochs之间的差异。你不需要以这种方式存储额外的数据,但你可以很容易地解决这个问题。