我目前正在研究一个需要我们存储大量时间序列数据的项目,但更重要的是,需要快速检索大量时间序列数据。关于如何存储和检索时间序列数据的建议
会有N个设备(> 10,000),它们会周期性地向系统发送数据,可以说每5秒钟一次。这些数据将很快建立起来,但我们通常只对最近的数据感兴趣,并且想要压缩旧数据。我们不想删除它,因为它仍然有用,但是一天中有数千个数据点,而我们可能在N天/周/月过去之后仅保存5或10个数据。
具体而言,我们希望能够在大量时间段(例如一两年)获取采样数据。这里可能有数百万个点,但我们只想要一个小的,线性分布的这个数据样本。
今天我们正在试验influxdb,它最初似乎是一个很好的解决方案。它速度很快,可以让我们将数据存储在合理的结构中,但我们发现它并不完全令人满意。我们无法执行上述的示例查询,并且通常系统对我们来说感觉不够成熟。
任何有关我们如何继续或任何解决方案的意见,都非常感谢。
谢谢你的回答。我们在influxdb中使用了一些称为保留策略和持续查询的方法。这些连续的查询将定期为我们采样数据,但在此期间,表中包含“陈旧”数据。如果我们每周抽样,那么我们总是比数据落后一周。如果我们每天都抽样,那么我们总是落后一天,等等。一个要求是始终能够获取绝对最新的数据(采样)。这是可能的TimescaleDB? –