对于任何复杂的事情,我认为预先计算数字会更容易,然后绘制它们。这是很容易与dplyr/tidyr(即使是错误吧)完成:
gather(df, 'cat', 'value', 1:2) %>%
group_by(factor, cat) %>%
summarise(mean=mean(value), se=sd(value)/sqrt(n())) %>%
group_by(cat) %>%
mutate(perc=mean/sum(mean), ymin=cumsum(perc) -se/sum(mean), ymax=cumsum(perc) + se/sum(mean)) %>%
ggplot(aes(x=cat, y=perc, fill=factor(factor))) +
geom_bar(stat='identity') +
geom_errorbar(aes(ymax=ymax, ymin=ymin))
当然,这看上去有些奇怪,因为有100%左右的误差条来堆叠条形。我想你会的方式更好ploting实际的数据点,加上手段和误差棒和使用刻面:
gather(df, 'cat', 'value', 1:2) %>%
group_by(cat, factor) %>%
summarise(mean=mean(value), se=sd(value)/sqrt(n())) %>%
ggplot(aes(x=cat, y=mean, colour=factor(factor))) +
geom_point(aes(y=value), position=position_jitter(width=.3, height=0), data=gather(df, 'cat', 'value', 1:2)) +
geom_point(shape=5, size = 3) +
geom_errorbar(aes(ymin=mean-se, ymax=mean+se), width=.1) +
facet_grid(factor ~ .)
这样,任何人都可以检查数据,看清楚它们是正常分布
为什么要堆叠条形图的方式?我认为他们很难解释。 – Heroka
我有六个测量每六个日期的三种物种。数据几乎是正态分布的,我想显示每个物种的年度变化。因此,这些条代表60个采样区的平均物种丰度。 – nouse