2016-02-13 120 views
-2

任何人都可以解释R语言中这四个语句之间的区别吗?R语言 - 差异统计结果

data 
[1] 18 22 18 20 20 20 20 17 17 16 20 17 21 19 18 19 13 21 19 14 22 19 20 20 16 19 21 19 17 20 15 20 18 19 26 21 19 22 20 24 25 
[42] 14 20 17 20 21 19 20 16 18 18 16 18 16 15 20 15 17 20 16 16 17 21 19 17 21 19 21 19 19 18 16 17 15 21 22 18 19 18 22 23 20 
[83] 21 17 17 15 12 23 18 19 18 21 18 17 18 22 16 20 21 18 

table(data) 
data 
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 
1 1 2 5 9 12 15 15 17 12 6 2 1 1 1 

hist(data) 
hist(data, probability=TRUE) 
hist(table(data)) 
hist(table(data), probability=TRUE) 

结果是: enter image description here

谢谢!

+0

看看[这个讨论](http://stackoverflow.com/questions/17416453/force-r-to-plot-histogram-as-probability-relative-frequency),因为它对应于你的问题。 – Konrad

+1

你有这些功能的帮助吗?使用'table'意味着你绘制的是与原始数据不同的信息,并且'probability'参数在那里被很好地描述。究竟什么是不明确的? – Molx

+0

是的,我已经看到了帮助,但我无法为每个图表分配一个名称。第一个代表不同值的频率,对吗?例如: :length(data [data> = 18&data <20]) 但是第三个?表函数返回不同的频率,对吗? – Mark116

回答

0

hist(data)是所述数据的historgam而hist(table(data))计数(即直方图的直方图)的直方图。第二个情节告诉你的是,大多数年龄在数据中出现0到5次。自变量probability=TRUE仅重新调整y轴以匹配测量的概率(=计数/总计)而不是计数。