从，使用R

我有2个文件如下从，使用R

文件1 2个不同的文件比较列：

Locus S1 S2 S3 
loc1 87 56 77 
loc2 34 55 75 
loc3 12 09 78 
loc4 34 67 89 
loc5 78 65 46

文件2：

Locus S1 S2 S3 
loc3 13 43 34 
loc5 43 56 90 
loc7 89 56 33 
loc1 56 88 00 
loc4 66 77 98 
loc2 34 44 66

我要比较/匹配“轨迹“这两个文件中的列，例如，在”new_output文件“中，我应该有来自File1的”locus“列的序列以及来自File2的各个基因座的值。

所以我的“new_output文件”应该是这样的，

Locus S1 S2 S3 
loc1 56 88 00 
loc2 34 44 66 
loc3 13 43 34 
loc4 66 77 98 
loc5 43 56 90

我想是这样，

file1 <-read.delim(file="file1.txt",header=TRUE,sep="\t") 
file2 <-read.delim(file="file2.txt",header=TRUE,sep="\t") 
new_output <- file1[file1$Locus %in% file2$Locus,] 
write.table(new_output,file="new_output.txt",sep="\t")

但那不是真的给我，结果我想要的方式。谁能帮我这个？并告诉我，我哪里错了？

来源

2012-10-02 Letin

您可以使用功能merge：

merge(file1["Locus"], file2, by = "Locus") 

# Locus S1 S2 S3 
#1 loc1 56 88 0 
#2 loc2 34 44 66 
#3 loc3 13 43 34 
#4 loc4 66 77 98 
#5 loc5 43 56 90

来源

2012-10-02 10:33:03

谢谢您的帮助:) – Letin

你接近。取而代之的%in%，使用match：

new_output <- file2[match(file1$Locus, file2$Locus), ]

你也可以做的是用什么作为Locus行名：

file1 <-read.delim(file = "file1.txt", header = TRUE, sep = "\t", row.names = 1) 
file2 <-read.delim(file = "file2.txt", header = TRUE, sep = "\t", row.names = 1) 
new_output <- file2[rownames(file1$Locus), ]

来源

2012-10-02 10:33:05 flodel

谢谢您的帮助:) – Letin

回答

相关问题