2014-01-20 49 views
3

我正在处理两个数据集,来自m cats,这是一个内置R数据集。两个数据集之间的平均值差异的置信区间

> cats 
    Sex Bwt Hwt 
1  F 2.0 7.0 
2  F 2.0 7.4 
3  F 2.0 9.5 
4  F 2.1 7.2 
5  F 2.1 7.3 
6  F 2.1 7.6 
7  F 2.1 8.1 
8  F 2.1 8.2 
9  F 2.1 8.3 
10 F 2.1 8.5 
11 F 2.1 8.7 
12 F 2.1 9.8 
... 
137 M 3.6 13.3 
138 M 3.6 14.8 
139 M 3.6 15.0 
140 M 3.7 11.0 
141 M 3.8 14.8 
142 M 3.8 16.8 
143 M 3.9 14.4 
144 M 3.9 20.5 

我想找到的手段的差异99%的置信区间(分别为性别== M和性别== F)男的BWT和女性之间的样本值

我知道t.test会这样做,除此之外,如果我将cats分解为包含男性和女性的Bwt的两个数据集,则t.test()会抱怨这两个数据集的长度不一样,这是正确的。 cats只有47名女性,87名男性。

它可以通过其他方式实现吗?还是通过分解数据来误解数据?

编辑: 我有一个功能,通过另一个问题是获取手段的CI上的数据集回答者向我建议,可以派上用场:

ci_func <- function(data, ALPHA){ 
    c(
    mean(data) - qnorm(1-ALPHA/2) * sd(data)/sqrt(length(data)), 
    mean(data) + qnorm(1-ALPHA/2) * sd(data)/sqrt(length(data)) 
    ) 
} 
+0

为什么不实际添加你试图代码 – Dason

+0

@Dason'T1 < - t.test(catsBwt_Female,catsBwt_Male,成对= TRUE)在complete.cases 误差(X,Y ):并非所有参数的长度都是相同的我已经尝试过的代码的范围,除了计算每个数据集的平均值的单独99%CI。一般来说,我是新来的统计数据。 –

+0

当你没有进行配对t检验时,为什么要指定paired = TRUE? – Dason

回答

4

您应该应用t.test与式接口:

t.test(Bwt ~ Sex, data=cats, conf.level=.99) 
+0

看起来我需要仔细阅读't.test'的文档。感谢您提供快速和完整的答案。 –

+1

请注意,您不必使用公式界面。主要问题是,如果数据不合理,则指定配对t检验。 – Dason

相关问题