2011-12-07 49 views
1

我有想将数据放入显示4个因子的每个子集内频率的直方图。我希望他们能够使用相同的直方图和不同的颜色。 ..ncount ..函数看起来是最好的,但它将数据规范化为最大值1,而我希望子集中所有频率的和等于1.下面是我的代码使用和伴随的图表:使用ggplot2绘制具有4级因子的频率直方图

我的数据文件是:“assocID” 的因素是:“类别” ,我使用直方图中的连续变量是:“QGM”

ggplot(assocID,aes(QGM)) + 
    geom_histogram(binwidth=0.1,aes(fill=category,y(..count..)),position="dodge") + 
    facet_wrap(~dyad) 

here看到三个输出图像。我是一个新的用于stackoverflow,所以他们不会让我张贴图像。我认为图表会比文字更好地解释!

现在如果我用(..count..)/sum(..count..)由总数只是划分,而不是子集

ggplot(assocID,aes(QGM)) + 
    geom_histogram(binwidth=0.1,aes(fill=category,y(..count..)/sum(..count..)),position="dodge") + 
    facet_wrap(~dyad) 

最后NCOUNT一个似乎没有任何做内。

ggplot(assocID,aes(QGM)) + 
    geom_histogram(binwidth=0.1,aes(fill=category,y(..ncount..)),position="dodge") + 
    facet_wrap(~dyad) 

基本上我想显示的频率的柱状图中的变量“类别”

任何帮助将是非常赞赏的每一个因素!

回答

3

这很难,因为你的例子不可重现,但我会采取刺探,你正在寻找..density..,其中documentationstat_bin将产生一个值合并为一。

此外,我假设y(..count..)打算是y = ..count..