2012-09-24 141 views
-1

我需要一些数据分析帮助。
我确实有两个数据集(之前的&之前),我想看看它们之间的差异有多大。比较多个数据帧

之前

11330 STAT1 
2721 STAT2 
52438 STAT3 
6124 SUZY 

17401 STAT1 
3462 STAT2 
0 STAT3 
72 SUZY 

试图给他们组tapply(before$V1, before$V2, FUN=mean)
但是,当我试图绘制它,在x轴上没有得到组名称,而是数字。 如何绘制这样的数据(Y轴上的频率&组名在X轴上)?

也想问一下,在R中比较这样的数据集是什么是正确的命令,我愿意找到它们之间的区别?


被修改

dput(前$ V1)
C(11330L,2721L,52438L,6124L)

dput($ V2之前)
结构(1: 4,.Label = c(“STAT1”,“STAT2”,“STAT3”,“SUZY”),class =“factor”)

+0

如何通过将组名称放在x轴上来比较这些数据集?每个值有两个值。 –

+1

我很愿意通过目测看到两块地块之间的区别,但我明白,有更好的做法。 – PoGibas

+0

这是什么样的“数据集”?我从数据配对的名称(STAT1 in before匹配STAT1 in after?)之后可以使用'dput(before1)'和'dput(before2)'发布'before1'和'before2'数据集的样本吗? –

回答

5

这里有几个想法。

这是我的认为你的数据看起来像什么?

before <- data.frame(val=c(11330,2721,52438,6124), 
        lab=c("STAT1","STAT2","STAT3","SUZY")) 
after <- data.frame(val=c(17401,3462,0,72), 
        lab=c("STAT1","STAT2","STAT3","SUZY")) 

它们合并成单个数据帧与period变量:

combined <- rbind(data.frame(before,period="before"), 
     data.frame(after,period="after")) 

重新格式化为一个矩阵和绘图与(碱R)dotchart

library(reshape2) 
m <- acast(combined,lab~period,value.var="val") 
dotchart(m) 

剧情与ggplot

library(ggplot2) 
qplot(lab,val,colour=period,data=combined) 
+1

感谢您的帮助!它解决了我的绘图问题,但我也想问一下,如果可以将这两组数据分开(之前/之后),以便至少获得多少次相互之间的差异。 – PoGibas

+0

你的意思是计算它们之间的差异吗?如果是这样,'$ val-before $ val'后出现了什么问题? (对于一个更大的集合,你可能想小心元素的顺序是相同的,但是你给我们的数据应该没问题?)否则,请编辑你的问题以提供更精确的问题(即,告诉我们这个特殊的小例子所期望的答案) –