2013-10-18 81 views
-2

我有两个数据集要比较它们的相似性,比如hapmap.table和thousand_genomes.table。我正在使用merge()函数搜索和检索相似的记录。但在hapmap文件中,染色体编号以chr1,chr2等形式输入,而其他染色体编号仅以数字形式输入。如何在合并之前从整个数据集中删除字符chr,非常感谢。删除用于合并r中两个数据集的字符子字符串

回答

1

假设CHROM是在hapmap.table

gsub("^chr","",hapmap.table$chrom) 

例染色体数目柱:

hh<-structure(list(hh = structure(1:3, .Label = c("chr12", "chr23", 
"chr45"), class = "factor")), .Names = "hh", row.names = c(NA, 
-3L), class = "data.frame") 

hh 
    hh 
1 chr12 
2 chr23 
3 chr45 

hh$hh<- gsub("^chr","",hh$hh) 

hh 
    hh 
1 12 
2 23 
3 45 
相关问题