我的数据在R中的间隔时间为5分钟

我尝试了一切，但找不到任何适用于我的数据的内容。我的数据在R中的间隔时间为5分钟

我有80,000行数据，我想写一些代码，平均每5行代码，显然轮流少了5倍的代码行数。

   timestamp curr_proc_units entitled_cycles capped_cycles 
1481000580 2016-12-05 23:03:00    1  512269820  17400328 
1481000640 2016-12-05 23:04:00    1  511754172  15196426 
1481000700 2016-12-05 23:05:00    1  512715413  17452370 
1481000760 2016-12-05 23:06:00    1  512334707  124006106 
1481000820 2016-12-05 23:07:00    1  510737517  34001018 
1481000880 2016-12-05 23:08:00    1  512152279  15343897 
     uncapped_cycles 
1481000580  47532.200 
1481000640  9154.117 
1481000700  45975.650 
1481000760  4018213.067 
1481000820  145820.350 
1481000880  41980.917

来源

2017-03-08 Kathryn Withers

所以在你这里显示的数据，时间邮票很漂亮的和一贯的。情况总是如此吗？第五条线总是在一分钟内进来吗？在这里区分时间很重要吗？另外，除了文件管理之外，还有一个原因是为了减少数据量吗？ – SeldomSeenSlim

是的，他们都是1分钟的间隔。 –

我们可以使用data.table

library(data.table) 
setDT(df1)[, lapply(.SD, mean), .(grp = cut(timestamp, breaks = "5 min"))]

来源

2017-03-08 14:31:44 akrun

谢谢我将尽力 –

setDT（rra）[，lapply（.SD，mean），。（grp = cut（timestamp，by =“5 min”）]我得到一个错误Error：unexpected']'in' setDT（rra）[，lapply（.SD，mean），。（grp = cut（timestamp，by =“5 min”）]“ –

@KathrynWithers有一个错字，我忘记了'''现在修正了 – akrun

随着dplyr：

library(dplyr) 
group_by(df, group = cut(timestamp, breaks = "5 min")) %>% 
    summarize_all(funs(mean(.)))

来源

2017-03-08 14:33:17 scoa

您可以通过创建'group' in'group_by' – akrun

我得到这个错误：eval中的错误（expr，envir，enclos ）：参数“breaks”缺失，没有默认调用：％>％... as.data.frame - > mutate_ - > mutate_.tbl_df - > mutate_impl - > .Call –

by should be breaks;看我的编辑 – scoa

我的数据在R中的间隔时间为5分钟

回答

相关问题