我从3个大数据表(名为A1,A2,A3)开始。每个表都有4个数据列(V1-V4),1个“日期”列,在所有三个表和数千行中保持不变。根据(部分)匹配的列名计算行平均值
下面是一些近似于我的表的虚拟数据。
A1.V1<-c(1,2,3,4)
A1.V2<-c(2,4,6,8)
A1.V3<-c(1,3,5,7)
A1.V4<-c(1,2,3,4)
A2.V1<-c(1,2,3,4)
A2.V2<-c(2,4,6,8)
A2.V3<-c(1,3,5,7)
A2.V4<-c(1,2,3,4)
A3.V1<-c(1,2,3,4)
A3.V2<-c(2,4,6,8)
A3.V3<-c(1,3,5,7)
A3.V4<-c(1,2,3,4)
Date<-c(2001,2002,2003,2004)
DF<-data.frame(Date, A1.V1,A1.V2,A1.V3,A1.V4,A2.V1,A2.V2,A2.V3,A2.V4,A3.V1,A3.V2,A3.V3,A3.V4)
因此,这是我的数据帧结束看起来像:
Date A1.V1 A1.V2 A1.V3 A1.V4 A2.V1 A2.V2 A2.V3 A2.V4 A3.V1 A3.V2 A3.V3 A3.V4
1 2001 1 2 1 1 1 2 1 1 1 2 1 1
2 2002 2 4 3 2 2 4 3 2 2 4 3 2
3 2003 3 6 5 3 3 6 5 3 3 6 5 3
4 2004 4 8 7 4 4 8 7 4 4 8 7 4
我的目标是计算该行的意思是每个从各个数据表的匹配列。所以在这个例子中,我希望所有列以V1结尾,所有列以V2结尾,所有列以V3结尾,所有列以V4结尾。
最终的结果是这样的
V1 V2 V3 V4
2001 1 2 1 1
2002 2 4 3 2
2003 3 6 5 3
2004 4 8 7 4
所以我的问题是,如何我去计算行基于列名部分匹配意味着什么?
感谢
我们可以假设我们可以不依赖于列的位置排序?即“匹配”列可能是不规则间隔的? – joran
不,我们不能依赖位置排序。而我正在使用的实际数据集有更多的列,所以指定列定位将是一个麻烦 – Vinterwoo