Advanced R提到了三种情况循环:就地修改,递归函数和while循环。既然你问了for
环路,这里是什么是对前两种情况的书面:
修改到位
如果您需要修改现有的数据帧的一部分,它通常最好使用for循环。例如,以下代码通过将函数列表的名称与数据框中变量的名称进行匹配来执行逐变量变换。
trans <- list(
disp = function(x) x * 0.0163871,
am = function(x) factor(x, levels = c("auto", "manual"))
)
for(var in names(trans)) {
mtcars[[var]] <- trans[[var]](mtcars[[var]])
}
我们通常不会使用lapply()来直接替换这个循环,但它是可能的。
递推关系
很难转换for循环成一个功能时元件之间的关系是不是独立的,或者是递归定义。例如,指数平滑通过对当前和以前的数据点进行加权平均来工作。下面的exps()函数实现了for循环的指数平滑。
exps <- function(x, alpha) {
s <- numeric(length(x) + 1)
for (i in seq_along(s)) {
if (i == 1) {
s[i] <- x[i]
} else {
s[i] <- alpha * x[i - 1] + (1 - alpha) * s[i - 1]
}
}
s
}
x <- runif(6)
exps(x, 0.5)
#> [1] 0.6622163 0.6622163 0.4758159 0.2703593 0.1896377 0.5506731 0.7300305
我们不能消除的循环,因为我们没有看到允许在位置i的输出依赖于输入和输出两个位置i的泛函 - 1
假设您想要在每次运行中分配值并将该值用于后续运行,可以使用'for'循环。虽然'减少'具有类似的潜力,我认为''循环'更好。 – akrun
请参阅Patrick Burns的R Inferno。只要预先分配对象,循环就可以。如果你想要超级速度,你最好使用一些专门的技术,比如使用'data.table'或者使用'Rcpp'。 –
此类问题已被问及。 @germcd找到了你的链接。 http://chat.stackoverflow.com/transcript/message/29792007#29792007 –