2017-05-19 12 views
0

我有一个数据帧结构如下:如何用多列来总结“长”格式的数据框?

Variable 1 | Variable 2 | Variable 3 | Outcome Variable 
---------- | ---------- | ---------- | ---------------- 
Factor  | Factor  | Factor  | Outcome 

了几千行,15列变量和1个输出列。我想总结一下表格(最好使用plyr),格式如下:

Variable 1 | Variable 2 | Variable 3 | Outcome Variable 
---------- | ---------- | ---------- | ---------------- 
Factor 1 | Factor 1 | Factor 1 | Average Outcome 
Factor 1 | Factor 1 | Factor 2 | Average Outcome 
Factor 1 | Factor 2 | Factor 1 | Average Outcome 
Factor 1 | Factor 2 | Factor 2 | Average Outcome 

对于不同的变量组合。什么是最简单的方法来做到这一点?

+1

可以在基地R.使用聚合'骨料(结果〜FAC1 + FAC2 + FAC3,数据= DAT, FUN =平均值)'。 – lmo

回答

0

我们可以使用dplyr

library(dplyr) 
df1 %>% 
    group_by(variable1, variable2, variable3) %>% 
    summarise(OutcomeVariable = mean(OutcomeVariable)) 

或用base R

aggregate(OutcomeVariable ~., df1, FUN = mean) 
相关问题