2015-12-03 22 views
0

有一些数据(蛋白质ID),例如:P91913 P0DM41 Q93573 P49197.我想下载序列信息http://www.uniprot.org,现在我可以下载一个,但是我想要下载很多。当我获得.fasta时,每个url仅在ID中有所不同。因此,我想把这些ID放在一个列表或框架上,然后通过ID一个接一个。现在这些ID是在一个文本文件中,如果我想使用循环语句来逐一获取ID,我该怎么办?不同ID的序列信息。提前致谢!把数据放在文本文件中的名单或名气

+0

根本不需要使用'XML'包。我相信我编辑的答案会做你的工作。 –

+0

我已经运行了您编辑的代码并获取了我想要获取的信息。但是我在文本文件中有很多ID,我想要在文本文件中获得所有ID的序列。因此,我猜是否可以处理用向量来构建一组向量,这样我就可以获得所有的序列信息。在开始时,我假装使用列表或框架并进行循环,但是我无法使其工作!我应该如何处理代码以及我说的方法是否可行!谢谢!@Ven Yao – changqi

+0

假设您有一个包含每行包含一个id的所有id的文件。然后,你可以简单地用'readLines'函数将你的文件读入R中。 x < - readLines(“allids.txt”)。然后继续我的答案。您可能需要阅读readLines和read.table等手册。 –

回答

0
x <- c("P91913", "P0DM41", "Q93573", "P49197") 
y <- sapply(x, function(i) { 
    url <- paste("http://www.uniprot.org/uniprot/", i, ".fasta", sep="") 
    return(readLines(url)) 
}) 

writeLines(unlist(y), "E:\\qq.txt") 
相关问题