我正在处理两个数据集,来自m cats
,这是一个内置R数据集。两个数据集之间的平均值差异的置信区间
> cats
Sex Bwt Hwt
1 F 2.0 7.0
2 F 2.0 7.4
3 F 2.0 9.5
4 F 2.1 7.2
5 F 2.1 7.3
6 F 2.1 7.6
7 F 2.1 8.1
8 F 2.1 8.2
9 F 2.1 8.3
10 F 2.1 8.5
11 F 2.1 8.7
12 F 2.1 9.8
...
137 M 3.6 13.3
138 M 3.6 14.8
139 M 3.6 15.0
140 M 3.7 11.0
141 M 3.8 14.8
142 M 3.8 16.8
143 M 3.9 14.4
144 M 3.9 20.5
我想找到的手段的差异99%的置信区间(分别为性别== M和性别== F)男的BWT和女性之间的样本值
我知道t.test
会这样做,除此之外,如果我将cats
分解为包含男性和女性的Bwt
的两个数据集,则t.test()会抱怨这两个数据集的长度不一样,这是正确的。 cats
只有47名女性,87名男性。
它可以通过其他方式实现吗?还是通过分解数据来误解数据?
编辑: 我有一个功能,通过另一个问题是获取手段的CI上的数据集回答者向我建议,可以派上用场:
ci_func <- function(data, ALPHA){
c(
mean(data) - qnorm(1-ALPHA/2) * sd(data)/sqrt(length(data)),
mean(data) + qnorm(1-ALPHA/2) * sd(data)/sqrt(length(data))
)
}
为什么不实际添加你试图代码 – Dason
@Dason'T1 < - t.test(catsBwt_Female,catsBwt_Male,成对= TRUE)在complete.cases 误差(X,Y ):并非所有参数的长度都是相同的我已经尝试过的代码的范围,除了计算每个数据集的平均值的单独99%CI。一般来说,我是新来的统计数据。 –
当你没有进行配对t检验时,为什么要指定paired = TRUE? – Dason