我对R很新,尝试了很多东西,但没有奏效。我的表看起来像这样:做R中的特定行的计算
data temp
11.01.15 11am 15
11.01.15 12am 16
11.01.15 13am 14
12.01.15 11am 13
12.01.15 12am 11
12.01.15 13am 11
,并继续对5192行和很多天,我要计算当日的平均值,测量总是每天做3次。所以我需要一个循环来计算1-3,4-6,7-9等行的值的平均值,并跟踪它们并保存在文件中。
我对R很新,尝试了很多东西,但没有奏效。我的表看起来像这样:做R中的特定行的计算
data temp
11.01.15 11am 15
11.01.15 12am 16
11.01.15 13am 14
12.01.15 11am 13
12.01.15 12am 11
12.01.15 13am 11
,并继续对5192行和很多天,我要计算当日的平均值,测量总是每天做3次。所以我需要一个循环来计算1-3,4-6,7-9等行的值的平均值,并跟踪它们并保存在文件中。
使用dplyr
包及其功能。我会猜测你有一个名为“日”或“日期”的变量和另一个你想要的日常变量的变量“x”。代码:
group_by(data, day) %>%
summarize(meanX = mean(x))
会返回一个数据帧与x的每一天中称为data
数据集的平均值。
如果你总是有三点意见,你可以计算出平均的temp
超过3模块假设你的数据称为df
tapply(df$temp, cumsum(seq(nrow(df)) %% 3 == 1L), mean)
# 1 2
# 15.00000 11.66667
另一种方式是data
转换为Date
类的计算平均过它。下面是使用data.table
library(data.table)
setDT(df)[, mean(temp), by = as.Date(data, "%d.%m.%y")]
# as.Date V1
# 1: 2015-01-11 15.00000
# 2: 2015-01-12 11.66667
您可以使用lapply做到这一点
req.out = do.call(rbind,
lapply(split(data, f = data$date),
function(x){
out = mean(x$measurement)
}))
其中,数据是您的包含数据帧的日期和列一个例子(我把它叫做如上测量),在您需要来计算平均值。
这将不起作用,因为每一天的度量都是唯一的。 –
如果时间戳是日变量的一部分,它将遇到问题。但'substr(day,1,8)'会照顾它。 – iacobus