2017-07-20 44 views
0

我已经在2列数值向量(R中)中获得了商店ID及其Zipcode的列表。我正在使用“Zipcode”包(https://cran.rproject.org/web/packages/zipcode/zipcode.pdf),并可以访问这些邮编的经/纬度坐标。邮政编码软件包有一个数据框,每个邮政编码,城市,州,以及所有邮编的经度和纬度(作为一个大型数据框)。将一列数据帧与另一列匹配,拉入其他列,合并成大数据集

我希望得到的经度和我的邮编纬度坐标,并将其添加为第3,4列(即店铺ID,邮编,经度,纬度)

有什么想法? 谢谢!

编辑:我试过合并函数(即)总共<-合并(CleanData,zipcode,by = zip),我得到一个错误,因为他们必须有相同数量的列?

回答

0

作为by参数传递的列名必须括在引号内。在此示例中,您不需要在合并中使用by参数,如果是,则zipcode是两个数据框中唯一的公用列。

实施例的数据集:

#cleanData 
d1<-tibble::tribble(~z,~id,131,1,114,2,155,5) 

#zipcode 
d2<- 
tibble::tribble(~z,~x,~y,131,2,5,166,2,6,162,6,5,177,7,1,114,2,1,155,5,9) 

result <- merge(d1,d2) 

给出

 z id x y 
    1 114 2 2 1 
    2 131 1 2 5 
    3 155 5 5 9 

可以通过简单地使用dplyr::select()除去从结果数据帧的任何不必要的列。假设你不需要列Ÿ(这可能是一个国家的名称,例如)

result <- dplyr::select(result, z, id, x) 
相关问题