2014-11-17 88 views
0

我有6000个报告。对于每份报告,报告中有多少垃圾。因此,我可以做的这个柱状图:R:直方图中的簇

boundaries = seq(0,1 , by=0.01) 
hist(hoeveel_rommel_per_rapport, breaks=boundaries) 

其中hoeveel_rommel_per_rapport是描述每个报告垃圾的向量。 enter image description here

现在我已经得到每个报告的集群编号。我想在直方图中给所有的聚类分配一种不同的颜色。这可能吗?

例如,第一个堆栈包含3个不同的簇,因此它获得3种颜色。

回答

0

您可以传递参数col你想要的颜色,我不知道,如果通过将像col = c("green", "red", "blue")颜色列表会做你想要什么,但你当然可以选择哪些颜色?他们有

+0

您好,感谢您的回答。我知道这个论点,但我想给每个集群一个不同的颜色。 – Anita

+0

你可以发布那么你有什么尝试和一个可重复的例子? – Llopis

+0

我还没有尝试过任何东西,因为我不知道如何做到这一点 – Anita

2

我'倾向于使用ggplot这样的东西。以下是使用组成数据的一些方法(将来,您应该提供数据或至少有代表性的样本)。

set.seed(1) # for reproducible example 
reports <- data.frame(garbage=rchisq(900,c(10,15,20))/50,cluster=LETTERS[1:3]) 

这看起来像你正在寻找 - 堆积直方图。

library(ggplot2) 
ggplot(reports) + 
    geom_histogram(aes(x=garbage, fill=cluster),binwidth=0.01) 

这使三个直方图在不同的面板 - 更清晰。

ggplot(reports) + 
    geom_histogram(aes(x=garbage, fill=cluster),binwidth=0.01) + 
    facet_wrap(~cluster,nc=1) 

重叠密度图在一个面板。

ggplot(reports) + 
    stat_density(aes(x=garbage, fill=cluster),position="identity",alpha=0.5)