2017-09-13 114 views
1

我试图将两个包含来自多个数据记录器的温度数据的大型数据帧结合起来。数据记录器和列名在每个数据框中都是相同的。一个数据帧包含比另一个数据帧更新的值。如何根据重叠的日期值追加数据框?

的数据基本上是这样的:

date.time   date   temp1 temp2 
2011-08-22 19:00 2011-08-22 11.265 5.562 
2011-08-22 20:00 2011-08-22 11.254 6.541 
2011-08-22 22:00 2011-08-22 12.256 5.456 
2011-08-22 23:00 2011-08-22 13.568 15.265 

date.time<-c("2011-08-22 19:00", "2011-08-22 20:00", "2011-08-22 22:00","2011-08-22 23:00") 
date<-c("2011-08-22","2011-08-22","2011-08-22","2011-08-22") 
temp1<-c(11.265,11.254,12.256,13.568) 
temp2<-c(5.562,6.541,5.456,15.265) 
df_old<-data.frame(date.time,date,temp1,temp2) 

和:

date.time   date   temp1 temp2 temp3 
2011-08-22 22:00 2011-08-22 12.256 5.456 24.598 
2011-08-22 23:00 2011-08-22 13.568 15.265 11.265 
2011-08-22 24:00 2011-08-22 11.275 5.563 25.295 
2011-08-23 00:00 2011-08-23 11.254 6.544 24.689 

date.time<-c("2011-08-22 22:00", "2011-08-22 23:00", "2011-08-22 24:00","2011-08-23 00:00") 
date<-c("2011-08-22","2011-08-22","2011-08-22","2011-08-23") 
temp1<-c(12.256,13.568,11.275,11.254) 
temp2<-c(5.456,15.265,5.563,6.544) 
temp3<-c(24.598,11.265,25.295,24.689) 
df_new<-data.frame(date.time,date,temp1,temp2,temp3) 

我想纵向基于date.time列共同的价值观走到一起加入这些:

date.time   date   temp1 temp2 temp3 
2011-08-21 19:00 2011-08-22 11.265 5.562 NA 
2011-08-21 20:00 2011-08-22 11.254 6.541 NA 
2011-08-21 22:00 2011-08-22 12.256 5.456 24.598 
2011-08-21 23:00 2011-08-22 13.568 15.265 11.265 
2011-08-21 24:00 2011-08-22 11.275 5.563 25.295 
2011-08-21 00:00 2011-08-23 11.254 6.544 24.689 

我试过用rbind.fill将其中的一个追加到另一个。

df_all<-rbind.fill(df_old, df_new) 

这确实说明了不同的列数。但是,它只是将一个列叠加在一起,而不是将具有共享值的行放在date.time列中。

我试过寻找如何做到这一点,但只发现如何基于共享列中的值并排合并数据框,但没有如何合并它们时,从上到下,当有重叠值。

谢谢!

回答

1

好像什么你所描述的是一个合并:

merge(df_old,df_new,by=c("date.time","date","temp1","temp2"),all=TRUE) 

输出:

  date.time  date temp1 temp2 temp3 
1 2011-08-22 19:00 2011-08-22 11.265 5.562  NA 
2 2011-08-22 20:00 2011-08-22 11.254 6.541  NA 
3 2011-08-22 22:00 2011-08-22 12.256 5.456 24.598 
4 2011-08-22 23:00 2011-08-22 13.568 15.265 11.265 
5 2011-08-22 24:00 2011-08-22 11.275 5.563 25.295 
6 2011-08-23 00:00 2011-08-23 11.254 6.544 24.689 

编辑:

正如@ eipi10建议,另一个选择做同样是:

library(dplyr) 

full_join(df_old, df_new) 
+1

也'库(dplyr); full_join(df_old,df_new)'。 – eipi10