“叠加”中的R

伯爵表和百分比表下面的脚本说明我的问题：“叠加”中的R

library(reshape2) 

set.seed(1) 
dummy.df <- data.frame(var_a=sample(letters[1:5],200,replace=TRUE), 
         var_b=sample(1:5,200,replace=TRUE), 
         stringsAsFactors=FALSE) 

temp1 <- addmargins(table(dummy.df[,c("var_a","var_b")]),1) 
temp2 <- formatC(addmargins(prop.table(table(dummy.df[,c("var_a","var_b")]),2),1)*100,digits=2,format="f") 

temp1.melt <- melt(temp1,id.vars="var_a") 
temp2.melt <- melt(temp2,id.vars="var_a") 

temp.output <- merge(temp1.melt,temp2.melt,by=c("var_a","var_b")) 
temp.output[,"value"] <- paste(temp.output[,"value.x"]," (",temp.output[,"value.y"],"%)",sep="") 
temp.output[,"var_a"] <- factor(temp.output[,"var_a"],levels=c("a","b","c","d","e","Sum")) 
temp.output <- dcast(temp.output,formula=var_a~var_b,value.var="value")

我的一个办公室平时工作是创建的表格，列出不同的变量之间的频率，通常我会包括表中的百分比（行/列百分比）也是如此。

之前，我知道函数addmargins，prop.table和as.data.frame.matrix，我使用大量melt和dcast从reshape2包这样的伎俩（即将表格转换为数据帧，melt它，做相应的部门给予的百分比，然后它）。现在我知道使用三种新的学习功能可以为我节省很多代码。

现在我想知道这是否可以提前一步，而不使用我上面提供的脚本，并创建一个行/列的百分比表旁边的实际计数的表？

来源

2013-01-25 lokheart

如果列数为N，则这取两个表并重新排列。既然你已经想通了列重命名，我不会与来烦你：

temp12 <- cbind(temp1, temp2) 
stopifnot(ncol(temp1) == ncol(temp2)) 
data.frame(var_a=rownames(temp1), temp12[ ,c(t(matrix(1:10, 5,2))) ]) 
#----- 
    var_a X1 X1.1 X2 X2.1 X3 X3.1 X4 X4.1 X5 X5.1 
a  a 7 15.22 9 18.75 7 17.07 4 14.29 2 5.41 
b  b 13 28.26 12 25.00 6 14.63 5 17.86 9 24.32 
c  c 9 19.57 9 18.75 9 21.95 3 10.71 13 35.14 
d  d 9 19.57 9 18.75 8 19.51 12 42.86 10 27.03 
e  e 8 17.39 9 18.75 11 26.83 4 14.29 3 8.11 
Sum Sum 46 100.00 48 100.00 41 100.00 28 100.00 37 100.00

（你可以使用相同的矩阵转置伎俩从构造列名两个附加的载体选择）。

来源

2013-01-25 02:25:26

啊，它是接近的，但是您的表列数减去了一倍 – lokheart

不确定你的意思。你是指第一列不是组标签的事实吗？如果是这样，就处理好了。 –

@DWin可能会建议用矩阵（seq（1，ncol（temp1）* 2），ncol（temp1），2）'替换矩阵（1:10，5,2）'...... – agstudy

“叠加”中的R

回答

相关问题