2015-06-02 72 views
44

借此样品变量ř扩频的多个列与tidyr

df <- data.frame(month=rep(1:3,2), 
       student=rep(c("Amy", "Bob"), each=3), 
       A=c(9, 7, 6, 8, 6, 9), 
       B=c(6, 7, 8, 5, 6, 7)) 

我可以使用spreadtidyr此更改为宽格式。

> df[, -4] %>% spread(student, A) 
    month Amy Bob 
1  1 9 8 
2  2 7 6 
3  3 6 9 

但我该如何传播两个值,例如既AB,使得输出是一样的东西

month Amy.A Bob.A Amy.B Bob.B 
1  1  9  8  6  5 
2  2  7  6  7  6 
3  3  6  9  8  7 

回答

95

下面是使用data.table

library(data.table) ## v >= 1.9.6 
dcast(setDT(df), month ~ student, value.var = c("A", "B")) 
# month Amy_A Bob_A Amy_B Bob_B 
# 1:  1  9  8  6  5 
# 2:  2  7  6  7  6 
# 3:  3  6  9  8  7 

或可能tidyr解决

df %>% 
    gather(variable, value, -(month:student)) %>% 
    unite(temp, student, variable) %>% 
    spread(temp, value) 

# month Amy_A Amy_B Bob_A Bob_B 
# 1  1  9  6  8  5 
# 2  2  7  7  6  6 
# 3  3  6  8  9  7 
+0

我有可能既简单又非常有效的解决方案同样的问题,但我有一些几个学生,A和B多个条目。该代码给出了以下错误:错误:行的重复标识符。请帮忙。 –

+1

@PolarBear你想如何处理愚蠢?你想总结一下吗?意思?尝试'data.table'解决方案并将'fun.aggregate = sum'添加到'dcast'中 –

+0

我想在tidyr的帮助下取中位数的模糊数 –