0
希望有人可以提供帮助。我在R中有很多ortholog映射,这被证明是非常耗时的。我已经在下面发布了一个示例结构。显而易见的答案,例如逐行迭代(用于i:1:nrow(df))和字符串分割,或者使用sapply已经尝试过,速度非常慢。因此,我希望有一个向量化的选项。优化R中的匹配
stringsasFactors = F
# example accession mapping
map <- data.frame(source = c("1", "2 4", "3", "4 6 8", "9"),
target = c("a b", "c", "d e f", "g", "h i"))
# example protein list
df <- data.frame(sourceIDs = c("1 2", "3", "4", "5", "8 9"))
# now, map df$sourceIDs to map$target
# expected output
> matches
[1] "a b c" "d e f" "g" "" "g h i"
我感谢任何帮助!
'lapply(地图,strsplit,分裂='“)'给我一个错误。这对你有用吗? – CPak
这是一个很好的解决方案。谢谢。 – user8173495
@ChiPak我从原来的例子中假设'options(stringsAsFactors = FALSE)'。如果“map”的列是因素,我的解决方案将不起作用。 –