ncbi

    1热度

    3回答

    我有一个向量,其后可能跟有零个或多个以“/”开头的限定符。第一个要素应该始终是一个术语。 mesh <- c("Animals", "/physiology" , "/metabolism*", "Insects", "Arabidopsis", "/immunology") 我想参加预选赛的最后期限,并得到一个新的向量 Animals/physiology Animals/m

    0热度

    2回答

    我试图从ncbi下载与一个有机体相关的所有fasta文件。 我试图wget -r -l3 -A "*.fna.gz" ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/bacteria/Microcystis_aeruginosa/获得从第三级倒在.fna.gz结尾的文件,但当时它只是拒绝一切与以下的输出: 删除“ftp.ncbi.nlm.nih.gov/基因组/

    1热度

    1回答

    我目前正在尝试更新一些工作中的代码。我以前使用最新版本的Python创建了一个脚本,它在NCBI的FTP网页上记录用户路径选择(ftp://ftp.ncbi.nlm.nih.gov/)。日志被用来更新我的文件系统与更新的文件(NCBI每周更新他们的文件,我相信)。我基本上重新创建了轮子。我现在想使用rsync,但我似乎无法得到我想要的东西...... rsync -vah --include "\

    1热度

    1回答

    我试图访问NCBI SRA数据库,查询它的ID列表并将输出保存到矩阵。 我正在使用Bioconductor的sradb软件包来做到这一点,现在我可以访问和查询数据库,但它真的很慢,我不知道如何保存循环输出。 文件GPL11154_GSMs.txt包含我感兴趣的ID和它看起来像这样: GSM616127 GSM616128 GSM616129 GSM663427 GSM665037 我现

    0热度

    1回答

    我并不是很熟悉R,但我试图学习如何使用biomaRt软件包来查找位于我感兴趣的区域的基因。 我已经成功使用ENSEMBL数据集用下面的代码产生一个有效的输出: > mart= useMart(biomart="ensembl",dataset="hsapiens_gene_ensembl") > results <- getBM(attributes =c("chromosome_name","

    1热度

    1回答

    我想从NCBI使用Biopython和登录号列表下载genbank文件(请注意,我将这个脚本的电子邮件地址作为参数,例如python scriptName.py EMAILADDRESS) import os import os.path import sys from Bio import Entrez import datetime

    2热度

    1回答

    我想用它来转换一堆标识符,但我需要确切地知道哪个分类等级被分配给每个分类标准代码。下面显示的是一个有意义的转换示例,但我不知道如何标记某些分类调用。基本的分类等级是:(域,王国,门,类,次序,家庭,属和物种)https://en.wikipedia.org/wiki/Taxonomic_rank。 对于大多数情况下,它很容易,但在细菌的亚种和菌株的情况下,这可能会引起混淆。 如何获得ete3来指定

    0热度

    1回答

    我正在配置Blast +在我的mac上(os sierra)并且在配置我也在本地下载的nr和nt数据库时遇到了问题。我正在尝试关注NCBI的指令here,并且正在执行配置和执行步骤。 他们说改变我的.bash_profile,以便它说: export PATH=$PATH:$HOME/Documents/Luke/Research/Pedulla\ 17-18/blast/ncbi-blast-2

    -1热度

    1回答

    我想从Python中收集来自Entrez的蛋白质FASTA序列2.7。我正在寻找其名称中含有关键字“terminase”和“large”的任何蛋白质。到目前为止,我得到这个代码: from Bio import Entrez Entrez.email = "[email protected]" searchResultHandle = Entrez.esearch(db="protein"

    0热度

    1回答

    我想通过循环将多个GSM文件加载到R,但我认为我错过了一些明显的东西。 #Use i to loop through NCBI files GSM9714940 through GSM971948 for (i in 971940:971948){ (GSMName <- paste("GSM", i, sep = "")) #Define the actual file name