假设在著名iris
数据集选择性地移除列值,我已确定,当Sepal.Length> 5.0,还有在我的测定装置的误差。
在这个人为的例子中,我想保留Sepal.Length列的原始值,但如果该行的Sepal.Length> 5.0,则将其余列更改为NA
。
作为一个例子,这样的:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
会变成这样:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 NA NA NA NA
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 NA 1.7 NA NA
我可以通过一定的量化手动完成。沿线的东西:
iris$Sepal.Width <- ifelse(iris$Sepal.Length > 5.0, NA, iris$Sepal.Width)
然而,在这种方法中,我需要手动指定每一列。
问题
我强烈怀疑有一个聪明的方式通过任何purrr
或dplyr
来解决这个。尽管如此,我已经让自己失望了一个/modify_at
兔子洞。对优雅的任何建议将不胜感激。
谢谢!
我喜欢这个配方。它干净可读 - 感谢称重! – amormachine