ncbi

1热度

3回答

我有一个向量，其后可能跟有零个或多个以“/”开头的限定符。第一个要素应该始终是一个术语。 mesh <- c("Animals", "/physiology" , "/metabolism*", "Insects", "Arabidopsis", "/immunology") 我想参加预选赛的最后期限，并得到一个新的向量 Animals/physiology Animals/m

0热度

2回答

从ncbi下载多个fasta文件

我试图从ncbi下载与一个有机体相关的所有fasta文件。我试图wget -r -l3 -A "*.fna.gz" ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/bacteria/Microcystis_aeruginosa/获得从第三级倒在.fna.gz结尾的文件，但当时它只是拒绝一切与以下的输出：删除“ftp.ncbi.nlm.nih.gov/基因组/

1热度

1回答

为什么在连接到NCBI的FTP服务器主页时rsync无法工作？

我目前正在尝试更新一些工作中的代码。我以前使用最新版本的Python创建了一个脚本，它在NCBI的FTP网页上记录用户路径选择（ftp://ftp.ncbi.nlm.nih.gov/）。日志被用来更新我的文件系统与更新的文件（NCBI每周更新他们的文件，我相信）。我基本上重新创建了轮子。我现在想使用rsync，但我似乎无法得到我想要的东西...... rsync -vah --include "\

1热度

1回答

循环保存输出到矩阵

我试图访问NCBI SRA数据库，查询它的ID列表并将输出保存到矩阵。我正在使用Bioconductor的sradb软件包来做到这一点，现在我可以访问和查询数据库，但它真的很慢，我不知道如何保存循环输出。文件GPL11154_GSMs.txt包含我感兴趣的ID和它看起来像这样： GSM616127 GSM616128 GSM616129 GSM663427 GSM665037 我现

0热度

1回答

如何在biomaRt R软件包中使用NCBI基因数据库

我并不是很熟悉R，但我试图学习如何使用biomaRt软件包来查找位于我感兴趣的区域的基因。我已经成功使用ENSEMBL数据集用下面的代码产生一个有效的输出： > mart= useMart(biomart="ensembl",dataset="hsapiens_gene_ensembl") > results <- getBM(attributes =c("chromosome_name","

1热度

1回答

socket.gaierror下载genbank文件w/biopython

我想从NCBI使用Biopython和登录号列表下载genbank文件（请注意，我将这个脚本的电子邮件地址作为参数，例如python scriptName.py EMAILADDRESS） import os import os.path import sys from Bio import Entrez import datetime

2热度

1回答

ete3：如何从分类标识中获得分类级别名称？

我想用它来转换一堆标识符，但我需要确切地知道哪个分类等级被分配给每个分类标准代码。下面显示的是一个有意义的转换示例，但我不知道如何标记某些分类调用。基本的分类等级是:(域，王国，门，类，次序，家庭，属和物种）https://en.wikipedia.org/wiki/Taxonomic_rank。对于大多数情况下，它很容易，但在细菌的亚种和菌株的情况下，这可能会引起混淆。如何获得ete3来指定

0热度

1回答

Blast +本地配置：如何配置nt和nr数据库？

我正在配置Blast +在我的mac上（os sierra）并且在配置我也在本地下载的nr和nt数据库时遇到了问题。我正在尝试关注NCBI的指令here，并且正在执行配置和执行步骤。他们说改变我的.bash_profile，以便它说： export PATH=$PATH:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/ncbi-blast-2

-1热度

1回答

基于Python的关键字获取蛋白质FASTA序列

我想从Python中收集来自Entrez的蛋白质FASTA序列2.7。我正在寻找其名称中含有关键字“terminase”和“large”的任何蛋白质。到目前为止，我得到这个代码： from Bio import Entrez Entrez.email = "[email protected]" searchResultHandle = Entrez.esearch(db="protein"

0热度

1回答

用循环将多个GSM文件加载到R中？

我想通过循环将多个GSM文件加载到R，但我认为我错过了一些明显的东西。 #Use i to loop through NCBI files GSM9714940 through GSM971948 for (i in 971940:971948){ (GSMName <- paste("GSM", i, sep = "")) #Define the actual file name