我有一项任务可以对时间序列数据进行异常检测。我有异常检测的代码,但我正在为它准备数据。数据如下所示。为异常检测准备数据
timestampUtc
2016-08-01 14:38:01, 2016-08-01 14:38:06, 2016-08-01 14:38:12, 2016-08-01 14:38:18, 2016-08-01 14:38:22, 2016-08-01 14:38:27, 2016-08-01 14:38:27, 2016-08-01 14:38:30, 2016-08-01 14:38:37, 2016-08-01 14:38:38, 2016-08-01 14:38:38, 2016-08-01 14:38:46, 2016-08-01 14:39:03, 2016-08-01 14:39:03, 2016-08-01 14:39:10, 2016-08-01 14:39:12, 2016-08-01 14:39:15, 2016-08-01 14:39:16, 2016-08-01 14:39:20, 2016-08-01 14:39:28
首先我想在timestampUtc
列中做秒零。接下来,我想创建一个表示count
的列,并希望计算该特定分钟的值的数量。例如,输出应该是这样的:
timestampUtc count
2016-08-01 14:38:00 12, 2016-08-01 14:39:00 6, 2016-08-01 14:40:00 8
我想你可以避免总结一堆,如果你只是使用:'df < - 聚合(计数〜时间戳,数据= df,乐趣=长度)' –