2016-06-09 171 views
4

什么是“零均值和单位方差”以及如何计算/归一化R中的单列文件?我还希望将归一化值分成两类:如何计算/归一化零均值和单位方差

  1. 归一化值的标准偏差(SD)的平均值之上的至少0.5
  2. 归一化值的至少0.5的平均标准偏差(SD)下面

由于

回答

4

引证“零均值和单位方差”是指归一化的变量的0均值和1.一种方法中的R正常化变量的标准偏差(和方差)是使用scale功能。这里有一个例子:

# create vector 
set.seed(1234) 
temp <- rnorm(20, 3, 7) 

# take a look 
> mean(temp) 
[1] 1.245352 
> sd(temp) 
[1] 7.096653 

# scale vector 
tempScaled <- c(scale(temp)) 

# take a look 
> mean(tempScaled) 
[1] 1.112391e-17 
> sd(tempScaled) 
[1] 1 

# find values below 0.5 standard deviation in scaled vector 
tempScaled[tempScaled < -0.5] 
# find values above 0.5 standard deviation in scaled vector 
tempScaled[tempScaled > 0.5] 

您还可以通过扩展用手变量很容易地:

tempScaled2 <- (temp - mean(temp))/sd(temp) 

> all.equal(tempScaled, tempScaled2) 
[1] TRUE