-2
我有两个数据集要比较它们的相似性,比如hapmap.table和thousand_genomes.table。我正在使用merge()函数搜索和检索相似的记录。但在hapmap文件中,染色体编号以chr1,chr2等形式输入,而其他染色体编号仅以数字形式输入。如何在合并之前从整个数据集中删除字符chr,非常感谢。删除用于合并r中两个数据集的字符子字符串
我有两个数据集要比较它们的相似性,比如hapmap.table和thousand_genomes.table。我正在使用merge()函数搜索和检索相似的记录。但在hapmap文件中,染色体编号以chr1,chr2等形式输入,而其他染色体编号仅以数字形式输入。如何在合并之前从整个数据集中删除字符chr,非常感谢。删除用于合并r中两个数据集的字符子字符串
假设CHROM是在hapmap.table
gsub("^chr","",hapmap.table$chrom)
例染色体数目柱:
hh<-structure(list(hh = structure(1:3, .Label = c("chr12", "chr23",
"chr45"), class = "factor")), .Names = "hh", row.names = c(NA,
-3L), class = "data.frame")
hh
hh
1 chr12
2 chr23
3 chr45
hh$hh<- gsub("^chr","",hh$hh)
hh
hh
1 12
2 23
3 45