2013-04-11 62 views
0

考虑以下几点:平均值与fivenum:不同的结果?

> foo 
[1] 0 0 159 24 0 829 0 157 46 12 5 5 166 166 5 12 5 5 166 166 5 35 
> mean(foo) 
[1] 89.45455 
> summary(fivenum(foo)) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
     0  5  12  201  159  829 

什么SMEG?我不明白为什么fivenum会计算与“mean”不同的数字。我想问题是我,但我无法弄清楚我做错了什么。

回答

4

你为什么打电话summaryfivenum

比较:

foo <- c(0, 0, 159, 24, 0, 829, 0, 157, 46, 12, 5, 5, 166, 166, 5, 12, 
     5, 5, 166, 166, 5, 35) 
> mean(foo) 
[1] 89.45455 
> summary(foo) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
    0.00 5.00 12.00 89.45 158.50 829.00 
> fivenum(foo) 
[1] 0 5 12 159 829 
> mean(fivenum(foo)) 
[1] 201 
> summary(fivenum(foo)) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
     0  5  12  201  159  829 

fivenum返回长度五个的载体“返回Tukey的5号摘要(最小,低铰链,中位数,上部铰链,最大),用于将输入数据”。。请注意,在此处没有提及mean :)

因此,当您做summary(fivenum(foo))时,您正在计算矢量c(0, 5, 12, 159, 829)的汇总统计。对于那个矢量,mean确实是201.

+0

+ 1 - 还提到'fivenum'也不计算平均值。 – mnel 2013-04-11 06:11:43

+0

@ mnel,完成。正在编辑我的答案以显示帮助页面的第一行。 – A5C1D2H2I1M1N2O1R2T1 2013-04-11 06:12:49

+0

* headlap *非常愚蠢。谢谢! – Daniel 2013-04-11 06:14:20

1

我想在这里添加几个更多的观点,因为我在汇总()和fivenum()给出的四分位数之间看到了一些混淆。

首先 - 摘要()给出以下汇总统计: [最小] [第一四分位] [平均] [平均数] [第三四分位] [最大]

其中如,

fivenum()返回Tukey的五个号码摘要,即 [最小] [下铰链] [中位数] [上铰链] [最大]

这里是混乱 - 四分之一和下/上铰链之间有什么区别?

让我用一个例子解释 - R中试试这个:

首先 - (在这个例子中5)用向量“Y”奇数值的

> > y=c(2, 5, 8, 15, 8) 
> > summary(y) Min. 1st Qu. Median Mean 3rd Qu. Max. 
>  2.0  5.0  8.0  7.6  8.0 15.0 
> > fivenum(y) [1] 2 5 8 8 15 

正如你所看到的除了summary()给出的平均值以及fivenum()显示的内容之外,结果是相同的。

现在我只包含一个变量(新值:12)并将此向量定义为“z”;需要注意的是矢量计数为偶数(6个值)

> z=c(2, 5, 8, 12, 15, 18) 
> summary(z) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
    2.00 5.75 10.00 10.00 14.25 18.00 
> fivenum(z) 
[1] 2 5 10 15 18 

现在看到的区别 - 而汇总()给你的四分位数(以四分位数或百分公式计算值),这是fivenum()不 - 使它很简单 - 你可以不用数学计算:fivenum()输出的

说明:

首先,分钟,平均&最大值由fivenum()给出的直 前进!值的

下铰链=中间值到小于10 =中间值的 (2,5,8)= 5

上的值的(ALL 值的中位数)=中位数的左侧铰链中的值的中位数=对属于 (12,15,18)大于10 =中间值的值的(ALL 值的中位数)=中位数的右侧= 15