我想模拟一些dna-sequencing读取,并且为了加速代码,我需要并行运行它。基本上,我想要做的是以下几点:我从人类基因组中取样读取,并且我认为从多处理模块的两个过程中的一个尝试从相同的文件(人类基因组)中获取数据进程被破坏,无法获得所需的DNA序列。我尝试过不同的事情,但我对并行编程非常陌生,并且我无法解决我的问题 当我使用一个内核运行脚本时,它工作正常。 这是我调用该函数 if __nam
我试图按照文件中序列的字母顺序(而不是序列的ID)对fasta文件进行排序。 fasta文件包含200多个序列,我试图在一个位主(使用python代码)内找到重复数据(通过重复数据表示几乎相同的蛋白质序列,但不是相同的ID)。 所以我想从fasta文件中创建一个字典,然后对字典的值进行排序。 我想使用的代码如下: from Bio import SeqIO
input_file = open
我无法在命令行(bash)中将python(python变量)中的字符串作为输入传递给序列比对程序(muscle)。 muscle可以从命令行获取stdin,例如: ~# echo -e ">1\nATTTCTCT\n>2\nATTTCTCC" | muscle
MUSCLE v3.8.31 by Robert C. Edgar
http://www.drive5.com/muscle
我已经使用C:\ Python36中的.exe文件安装了Python。我使用Anaconda Distribution,并使用C:\ Anaconda3中的.exe进行安装。我已经安装使用biopython以下提示命令: cd Python36 (to go into Python36 directory)
cd Scripts (to go into Scripts directory)
p
我正尝试使用biopython和python3自动下载pdbs。但是对于几个pdbs,我遇到了404错误的问题。 urllib.error.HTTPError: HTTP Error 404: Not Found
一个例子,这就是它不能正常工作,但应该是:4YUU 数据库PDB文件退出,我没有看到的PDBS任何差异biopython下载。任何帮助,将不胜感激。 该代码是用来: import B
我正在使用pymol的迭代获取所有残基编号,然后使用它们检索残基名称。我认为这不是最好的办法。我试图寻找一种biopython的方式无济于事。我希望你的意见和建议。 一个侧面的问题,有时甚至是链[i] .resname给我一个KeyError:('','number','')带有一定的残基,这使我使用try和except块。任何替代品? from Bio import *
from Bio.PD