我有一个非常大的data.table
与4列,其中只有一个是完全独特的。很难解释,但它看起来像这样:基于几列折叠data.table
ENSEMBL ENTREZID SYMBOL ALIAS
1 ENSG00000000003 7105 TSPAN6 T245
2 ENSG00000000003 7105 TSPAN6 TM4SF6
3 ENSG00000000003 7105 TSPAN6 TSPAN-6
4 ENSG00000000003 7105 TSPAN6 TSPAN6
5 ENSG00000000005 64102 TNMD BRICD4
6 ENSG00000000005 64102 TNMD CHM1L
我想基于第一3列将其折叠,使ALIAS
柱倒塌的值的列表。
我知道我可以做results <- setDT(df)[, list(ALIAS=paste(ALIAS, collapse = '|')) , ENSEMBL]
,但后来我失去了中间两个cols。
如果SYMBOL和ENTREZID是相同的每个ENSEMBL,使用也作为分组变量,即'setDT(DF), 。(ALIAS = paste(ALIAS,collapse =“|”)),c(names(df)[1:3])]' – akrun