我在格式的数据帧:删除相邻的重复r中
site_domain <- c('ebay.com','facebook.com','facebook.com','ebay.com','ebay.com','auto.com','ebay.com','facebook.com','auto.com','ebay.com','facebook.com','facebook.com','ebay.com','facebook.com','auto.com','auto.com')
id <- c(1, 1, 1,2,2,3,3,3,3,4,4,4,5,5,5,5)
file0 <- as.data.frame(cbind(site_domain,id))
我做了一组由“ID”来获得数据:
library(dplyr)
xx <- as.data.frame(file0 %>%
group_by(id) %>%
summarise(pages=paste(site_domain, collapse='_')))
的数据是这样的:
1 ebay.com_facebook.com_facebook.com
2 ebay.com_ebay.com
3 auto.com_ebay.com_facebook.com_auto.com
4 ebay.com_facebook.com_facebook.com
5 ebay.com_facebook.com_auto.com_auto.com
但是我想删除重复相邻,所以我要出去放像:
1 ebay.com_facebook.com
2 ebay.com
3 auto.com_ebay.com_facebook.com_auto.com
4 ebay.com_facebook.com
5 ebay.com_facebook.com_auto.com
我该如何做到这一点。
这看起来不错,但是我在第三行看到:输出应该是'auto.com_ebay.com_facebook.com_auto.com',但是这种方法给出:'aut o.com_ebay.com_facebook.com' ..任何帮助我们如何修改这个。 – PSraj
是的,它可能我会用新方法 – OdeToMyFiddle