的第一个字符我在R.多个R数据帧比较字符串检索是一致
df1<-as.data.frame(cbind(Site=c(1,2,3,4,5),Nucs=c("ACTG","ACT","GTAC","GTC","GACT")))
df2<-as.data.frame(cbind(Site=c(1,2,3,4,5),Nucs=c("AC","ATC","GTCA","GC","GAC")))
我试图确定以下数据帧什么最长的字符串,它是之间是一致的两个Nucs列。 到目前为止,我已经试过这样:
x1 <- strsplit(as.character(df1$Nucs),"")
x2 <- strsplit(as.character(df2$Nucs),"")
x <- Map(intersect, x1, x2)
sapply(x, paste0, collapse="")
这使我有以下几点:
[1] "AC" "ACT" "GTAC" "GC" "GAC"
这不完全是我想是因为在网站3的情况下,我有GTAC和GTCA所以我只需要字符串中前两个字符一致的字符,即GT。
有没有人有任何想法,我该如何去做这件事?