2017-03-08 113 views
0

我尝试了一切,但找不到任何适用于我的数据的内容。我的数据在R中的间隔时间为5分钟

我有80,000行数据,我想写一些代码,平均每5行代码,显然轮流少了5倍的代码行数。

   timestamp curr_proc_units entitled_cycles capped_cycles 
1481000580 2016-12-05 23:03:00    1  512269820  17400328 
1481000640 2016-12-05 23:04:00    1  511754172  15196426 
1481000700 2016-12-05 23:05:00    1  512715413  17452370 
1481000760 2016-12-05 23:06:00    1  512334707  124006106 
1481000820 2016-12-05 23:07:00    1  510737517  34001018 
1481000880 2016-12-05 23:08:00    1  512152279  15343897 
     uncapped_cycles 
1481000580  47532.200 
1481000640  9154.117 
1481000700  45975.650 
1481000760  4018213.067 
1481000820  145820.350 
1481000880  41980.917 
+0

所以在你这里显示的数据,时间邮票很漂亮的和一贯的。情况总是如此吗?第五条线总是在一分钟内进来吗?在这里区分时间很重要吗?另外,除了文件管理之外,还有一个原因是为了减少数据量吗? – SeldomSeenSlim

+0

是的,他们都是1分钟的间隔。 –

回答

1

我们可以使用data.table

library(data.table) 
setDT(df1)[, lapply(.SD, mean), .(grp = cut(timestamp, breaks = "5 min"))] 
+1

谢谢我将尽力 –

+0

setDT(rra)[,lapply(.SD,mean),。(grp = cut(timestamp,by =“5 min”)]我得到一个错误Error:unexpected']'in' setDT(rra)[,lapply(.SD,mean),。(grp = cut(timestamp,by =“5 min”)]“ –

+0

@KathrynWithers有一个错字,我忘记了'''现在修正了 – akrun

1

随着dplyr:

library(dplyr) 
group_by(df, group = cut(timestamp, breaks = "5 min")) %>% 
    summarize_all(funs(mean(.))) 
+0

您可以通过创建'group' in'group_by' – akrun

+0

我得到这个错误:eval中的错误(expr,envir,enclos ): 参数“breaks”缺失,没有默认 调用:%>%... as.data.frame - > mutate_ - > mutate_.tbl_df - > mutate_impl - > .Call –

+0

by should be breaks;看我的编辑 – scoa

相关问题