bioinformatics

    1热度

    1回答

    我想搜索并计算在较大序列(F)内发生的小DNA序列(R)的数量,但R有几个可能是变量。我认为最简单的方法是设置R的比率并在F中将所有命中数计数在80%以上,但似乎只执行此操作的命令(例如difflib的SequenceMatcher或get_close_matches)需要使用列表才能工作。我不能把F分成任何这样的名单。有任何想法吗? 编辑2:更多信息请求。 DNA片段(F)中存在一定数量的重复序

    1热度

    2回答

    我有这样(来自DNA测序)数据: read.lengths = c(100, 100, 200, 250, 300, 400, 400, 500, 500) 每个长度仅仅是一个数字的在读取DNA碱基。给定任意数量的分箱,绘制读取长度与计数的直方图非常简单。 ggplot(data.frame(read.lengths)) + geom_histogram(aes(x = read.length

    0热度

    2回答

    我目前正在编写“正在做”的程序,并绘制DNA样本的相位分析,并且出现了一些问题:Output plot HERE!右侧的图像来自MATLAB并且是它应该如何看起来的例子。左边的图像是从我的程序输出的。正如你所看到的蓝色图形看起来是正确的,但它是在不同的角度。我检查过代码,它和我的程序的MATLAB版本基本相同。无论如何,我会把它放在这里,也许有一个我不知道的错误。但如果不是这样,是否有一种“转向/

    1热度

    3回答

    请帮我解析一个VCF文件。我正在粘贴一个真实的例子。 输入: 1 1014143 rs786201005 C T . . RS=786201005;RSPOS=1014143;dbSNPBuildID=144;SSR=0;SAO=1;VP=0x050068000605000002110100;GENEINFO=ISG15:9636;WGT=1;VC=SNV;PM;PMC;NSN;REF;ASP;L

    0热度

    1回答

    我有一个数据集包含DNA序列,我想将它们转换成数字表示。本文件中: 这是什么过程(转变),我想搜索一下吗? 如何在python中应用它? 它可以作为一个大数组,作为数据集输入吗?

    -1热度

    1回答

    我想分配两个文件作为输入文件。下面一个例子: directory1 AB001.txt AB002.txt AB003.txt .... directory2 AB001.fasta AB002.fasta AB003.fasta .... 所以,我要遍历超过5000 * .txt文件与相应的* .fasta文件(总是相匹配的前缀)。所有* .txt文件应该执行的命令是:

    -4热度

    1回答

    我想如下修改如下程序: 第一行包含蛋白质的名称和计数随后的这种蛋白质的输出线(如N) 接下来的N行中的每一行都包含一个匹配信息:GBoxes的位置和实际匹配(记住存在扰动和X的即通配符,允许)。 脚本: import csv import matplotlib.pyplot as plt import numpy as np # all G boxes def match(x,y):

    1热度

    2回答

    我已经看过以前提过的关于在列表中保留'for循环'输出的问题,但我似乎无法将其应用于我的函数。 也许有人可以给我一个关于我做错了什么的线索。 dna_seqs <- list('id1', 'ATGGCAATAACCCCCCGTTTCTACTTCTAGAGGAGAAAAGT', 'id2', 'TCCGTTAAGATATTCTTACGTGTGACGTAGCTATGTATTTTGCAGAGCTGGC

    1热度

    1回答

    我要生成硒代半胱氨酸的标志,但是当我选择的选项与reduced_protein_alphabet我得到错误“但却难免重复字母” weblogo -f sc.txt -D fasta -o sc_logo -F pdf -a reduced_protein_alphabet -s large -n 100 -c chemistry

    1热度

    1回答

    我是新手,尝试使用snakemake(上周左右),以便处理较少的工作流细节,以前我编写了自己的特定工作流程通过python。 我生成了一个小工作流程,其中的步骤之间将使用Illumina PE读取并运行Kraken对他们。然后,我会解析Kraken输出的输出,以检测最常见的物种(在一组允许范围内),如果没有提供物种值(使用snakemake运行-s test.snake --config R1_r