2016-11-22 36 views
1

我有一个连续变量,并在x轴的分类。在分类变量中,顺序是有意义的,根据其索引来拟合回归是有意义的,我的意思是代替c('a', 'b', 'c')使用索引(order(c('a', 'b', 'c')),即c(1, 2, 3)),并使模型与此相适应。但是,如果一个变量不是数字,ggplot会拒绝匹配geom_smooth(method = lm)。好吧,那么我可以告诉它使用的顺序:ggplot2:拟合geom_smooth()像分类变量是连续的

geom_smooth(aes(x = order(hgcc), y = rtmean), method = lm) 

但随后它需要整列的索引从数据帧,这是不好用scales = 'free'刻面,当只有水平的一个子集x变量的变量出现在一个图上。在整个数据帧的指标是平均高得多,所以回归将远远右侧绘制:

regression pushed to right

这里是一个最小的工作例如:

require(ggplot2) 
load(url('http://www.ebi.ac.uk/~denes/54b510889336eb2591d8beff/sample_data.RData')) 

ggplot(adata12cc, aes(x = hgcc, y = rtmean, color = cls, size = log10(intensity))) + 
geom_point(stat = 'sum', alpha = 0.33) + 
geom_smooth(
    aes(x = order(hgcc), y = rtmean), 
    method = 'glm') + 
facet_wrap(~ uhgroup, scales = 'free') + 
scale_radius(guide = guide_legend(title = 'Intensity (log)')) + 
scale_color_discrete(guide = guide_legend(title = 'Class')) + 
xlab('Carbon count unsaturation') + 
ylab('Mean RT [min]') + 
ggtitle('RT vs. carbon count & unsaturation by headgroup') + 
theme(axis.title = element_text(size = 24), 
    axis.text.x = element_text(angle = 90, vjust = 0.5, size = 9, hjust = 1), 
    axis.text.y = element_text(size = 11), 
    plot.title = element_text(size = 21), 
    strip.text = element_text(size = 18), 
    panel.grid.minor.x = element_blank()) 

我知道这是不是做事的好方法,但是ggplot可以让生活变得如此简单,如果我可以引用这些变量并对它们进行一些操作,而这些变量是通过分面来进行子集化的。

回答

1

我想我已经得到了解决,但我不知道你想要什么......

的主要问题是,你的x值的标签,已经被uhgroup 分裂如果你看一下因素他们是PC-O(38.7)PC(38.7等...

因此,第一件事情是也为x轴创建一个新的hgcc值。

adata12cc$hgcc_value <-as.factor(substr(adata12cc$hgcc, (nchar(levels(adata12cc$hgcc)[adata12cc$hgcc])-5), nchar(levels(adata12cc$hgcc)[adata12cc$hgcc]))) 

然后另外一个问题是,你有不同的x轴为geom_pointgeom_smooth。一个是hgcc,另一个是order(hgcc_value)

解决方案是使用相同的值,在这里我使用as.numeric(hgcc_value)(而不是order()),并精确地在scale_x_continuous中断的标签。

ggplot(adata12cc, aes(x = as.numeric(hgcc_value), y = rtmean, color = cls, size = log10(intensity))) + 
    geom_point(stat = 'sum', alpha = 0.33) + 
    geom_smooth(
    aes(x = as.numeric(hgcc_value), y = rtmean), 
    method = 'glm') + 
    facet_wrap(~ uhgroup, scales = 'free') + 
    scale_radius(guide = guide_legend(title = 'Intensity (log)')) + 
    scale_color_discrete(guide = guide_legend(title = 'Class')) + 
    scale_x_continuous(name = "Carbon count unsaturation", 
        breaks=as.numeric(adata12cc$hgcc_value), 
        labels = adata12cc$hgcc_value, 
        minor_breaks = NULL)+ 
    ylab('Mean RT [min]') + 
    ggtitle('RT vs. carbon count & unsaturation by headgroup') + 
    theme(axis.title = element_text(size = 24), 
     axis.text.x = element_text(angle = 90, vjust = 0.5, size = 9, hjust = 1), 
     axis.text.y = element_text(size = 11), 
     plot.title = element_text(size = 21), 
     strip.text = element_text(size = 18), 
     panel.grid.minor.x = element_blank()) 

enter image description here

难道你要找的东西?

+0

哇,这真的有用!非常感谢! :) – deeenes

相关问题