我有一本书上显示的统计数据(用R)以下:如何在列的子集中最有效地将0 val设置为NA?
> pima$diastolic [pima$diastolic = = 0] <- NA
> pima$glucose [pima$glucose == 0] <- NA
> pima$triceps [pima$triceps == 0] <- NA
> pima$insulin [pima$insulin == 0] <- NA
> pima$bmi [pima$bmi == 0] <- NA
有没有办法做到这一点的一条线或更有效?我看到有这样的功能,例如与,应用,子集做类似的东西,但无法弄清楚如何把它们放在一起...
示例数据(如何读取它作为数据框(如pythons stringio) :
pregnant glucose diastolic triceps insulin bmi diabetes age test
1 6 148 72 35 0 33.6 0.627 50 positive
2 1 85 66 29 0 26.6 0.351 31 negative
3 8 183 64 0 0 23.3 0.672 32 positive
4 1 89 66 23 94 28.1 0.167 21 negative
5 0 137 40 35 168 43.1 2.288 33 positive
6 5 116 74 0 0 25.6 0.201 30 negative
你能为我们提供一些示例数据? –
如果你想用'NA'替换数据帧中的所有'0',你可以很容易地做到:'df [df == 0] < - NA' – DatamineR
或'is.na(df)< - df == 0' –