2017-03-24 114 views
0

我在四个独立的实验中使用tapply压缩在多种条件下生长的多种植物的大型数据集。 tapply然后吐出物种总结的输出。我试图将这些单独的物种从输出中提取出来用于进一步分析。所以,tapply给我这个(从一些虚拟数据):R tapply压缩结果

> tapply(results, list(trial,condition,species),mean) 
> 
, , species1 

     A   B   C   D 
1 -0.6357911 0.6127278 -0.23812194 -0.2769131 
2 -0.3851283 -0.5955274 -0.08072294 -0.7298832 
3 0.2029780 -1.0282842 0.11518872 -0.6522809 
4 -0.2254586 0.4215911 -0.84305584 -0.1108188 

, , species2 

     A   B   C   D 
1 -0.4762501 0.35766102 -0.53821633 -0.64798979 
2 0.0558234 0.18602479 -0.48208241 1.09532972 
3 -1.0695515 0.84401536 -0.02232301 -0.02064807 
4 -0.2423312 -0.02145042 -0.18834442 -0.08221573 

从哪里获得每一个物种的平均值,每个条件(A-d)下,在4个独立的实验(1-4)上运行。那么是否可以说,分离物种A,然后每列平均为1-4?

+0

这将是更容易帮助你,如果你提供的[重复的例子(http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)通过样本输入数据和该输入的期望输出,我们可以测试可能的解决方案。 – MrFlick

回答

0

不完全确定数据的结构。但这是一个尝试。

#Data generation function runif 
data_gen <- function() { 
    x <- 
    data.frame(A=runif(4, -1.005, 1.0049), 
     B=runif(4, -1.005, 1.0049), 
     C=runif(4, -1.005, 1.0049), 
     D=runif(4, -1.005, 1.0049)) 
    return(x) 
    } 

#Shape to similar structure 
data <- list(species1=data_gen(), 
     species2=data_gen(), 
     species3=data_gen(), 
     species4=data_gen()) 

#1.lapply break it up to column 1 == A 
#2.then sapply with a mean then transpose to 1 row 
#3.and finally convert to data.frame 
data_transf <- data.frame(t(sapply(lapply(data, '[[', 1),mean))) 

#Rename columns if necessary 
colnames(data_transf) <- paste0(colnames(data_transf),'_A_isolated_avg') 

data_transf