用R中另一个数据框的值填充缺失值（NAs）

如何使用另一个数据框中的值对另一个数据框中的缺失值进行分组？用R中另一个数据框的值填充缺失值（NAs）

比方说，我有两个数据集：

数据集1显示了一个国家每天生产的食物量。

country   day  tonnes of food 
## 1  china 1   6 
## 2  china 1   NA 
## 3  china 2   2 
## 4  china 2   NA

dataset2是食物的一天

country   day  average tonnes of food 
## 1  china 1   6 
## 3  china 2   2

平均量如何能填补在NAS数据集1与来自dataset2的平均值。

I.e. IF is.na(dataset1$tonnes)为真，那么，平均一日从dataset2$averagetonnes

来源

2016-01-09 user3200293

只是'合并（df1，df2）[ - 3]' –

'-3'做了什么？ – user3200293

删除合并中的第三列（原始数据中旧的第三列）。看看'merge（df1，df2）'。我认为'setNames（merge（df1，df2）[ - 3]，names（df1））'是最接近你想要的。 –

填写我们可以使用加入data.table

library(data.table) 
setDT(df1)[df2, on =c("country", "day")][is.na(tonnes.of.food), 
    tonnes.of.food:= average.tonnes.of.food][, average.tonnes.of.food:=NULL][] 
# country day tonnes.of.food 
#1: china 1    6 
#2: china 1    6 
#3: china 2    2 
#4: china 2    2

来源

2016-01-09 18:05:50 akrun

你知道使用base，reshape或plyr的答案吗？我不熟悉data.table。 – user3200293

@ user3200293它已发表在评论由RichardScriven – akrun

这并不能给出预期的结果。除非我正确地使用合并，而不是填写NA，它只是将每个数据集的列绑定在一起。 – user3200293

如果我理解你使用正确的match功能将解决您的问题。 数据：

df1 <- data.frame(country=c(rep('china1',2),rep('china2',2)),day=c(1,1,2,2),tof = c(6,NA,2,NA),stringsAsFactors = F) 
df2 <- data.frame(country=c('china1','china2'),day=c(1,2),atof = c(6,2),stringsAsFactors = F) 
df1 
    country day tof 
#1 china1 1 6 
#2 china1 1 NA 
#3 china2 2 2 
#4 china2 2 NA

这条线将与第二data.frame DF2的相应国家的平均值替换的NaS。 match函数产生匹配位置向量，[which(is.na(df1$tof))]选择“tof”列中存在NA的索引。

df1$tof[is.na(df1$tof)] <- df2$atof[match(df1$country,df2$country)][which(is.na(df1$tof))] 
df1 
    country day tof 
#1 china1 1 6 
#2 china1 1 6 
#3 china2 2 2 
#4 china2 2 2

来源

2016-01-10 13:52:02 hvollmeier

用R中另一个数据框的值填充缺失值（NAs）

回答

相关问题