2012-02-24 50 views
0

我曾经看到用于计算置信区间基于样本通常置信区间的用于计算置信区间

# set number of simulated data sets and sample size 
# mu is the mean for the normal 
    S <- 1000 
    n <- 15 
    mu <- 1 

覆盖下述R函数R上实施的问题的意思是计算如下。这里,sampmean.ses表示样本平均值的标准误差。我大都可以猜测这背后的逻辑。令我困惑的是R实现这个的方式,具体而言,outsampmean-t05*sampmean.ses <= mu打算做什么?看起来总和是要计算满足这两个条件的所有离散点。

t05 <- qt(0.975,n-1) 
    coverage <- sum((outsampmean-t05*sampmean.ses <= mu) & 
     (outsampmean+t05*sampmean.ses >= mu))/S 
+2

你忘了在这个问题中包含一些代码或其他信息吗?我无法理解这一点。 – joran 2012-02-24 19:15:24

+2

它看起来像一个教学示例,显示1000次置信区间中有多少次包含真实平均值,其中没有显示数据集的模拟和每个数据集的均值和平均值的计算。 – Aaron 2012-02-24 19:41:03

回答

2
S  <- 1000 
n  <- 15 
mu  <- 1  
sigma <- 50  
set.seed(1) 
matdat  <- matrix(rnorm(S*n, mean = mu, sd = sigma), nrow=S) 
outsampmean <- rowSums(matdat)/n 
sampmean.ses <- sqrt(rowSums((matdat-outsampmean)^2)/(n*(n-1))) 
t05   <- qt(0.975,n-1) 
coverage  <- sum((outsampmean-t05*sampmean.ses <= mu) & 
        (outsampmean+t05*sampmean.ses >= mu))/S 

会产生

> coverage 
[1] 0.946 

outsampmean-t05*sampmean.ses <= mu产生取决于TRUE或FALSE(有效地为1或0中的总和)是否置信区间的从结果样品计算出的下边界均值和样本均值标准误差低于或高于总体均值。