dna-sequence

    0热度

    2回答

    我真的很难学习Python 3,现在我正在为这一个练习而努力。 我必须写一个函数,使用两个参数: 1)它是一种DNA序列的字符串。 2)相同的长度作为参数酮(也DNA序列) 函数必须返回一个浮子(那是在两个DNA序列相同的碱基比例的字符串)。 所以,我知道我必须写,这将返回类似这样的功能: seq_similarity("ATGC","AGTT") 应该返回 0.75 我只走到这一步,现在

    0热度

    1回答

    我有一个数据集包含DNA序列,我想将它们转换成数字表示。本文件中: 这是什么过程(转变),我想搜索一下吗? 如何在python中应用它? 它可以作为一个大数组,作为数据集输入吗?

    2热度

    1回答

    这是我必须实现我的目标,如标题中所述的代码。我现在似乎遇到的问题是第二行代码。我添加它的那一刻,程序停止工作,没有给我一个错误。先谢谢您的帮助。 seqDNA = input() seqDNA = seqDNA.upper() comp = '' for c in seqDNA: if c == 'a': comp = comp + 'u' elif c ==

    0热度

    1回答

    如何循环通过配对结束fastq文件?对于单端读取,你可以做以下 library(ShortRead) strm <- FastqStreamer("./my.fastq.gz") repeat { fq <- yield(strm) if (length(fq) == 0) break #do things writeFasta(fq,

    0热度

    1回答

    counter=0 i=0 dna_string = "CGATATATCCATAG" if dna_string[i:i+len("ATA")]=="ATA": counter=counter+1 print (counter) 0 我试图数数。在dna_string中出现的“ATA”这应该给出3的答案,但它给出了0!

    3热度

    1回答

    所以我给出了对齐2个DNA序列中最低成本的任务。一个失败的输入是 CGCAATTCTGAAGCGCTGGGGAAGACGGGT & TATCCCATCGAACGCCTATTCTAGGAT 在正确对准成本24,但我得到的23 成本,我要读的切换成本基础说,一个A - > T,G - > C等等我给出的成本文件是 *,-,A,T,G,C -,0,1,2,1,3 A,1,0,1,5,1 T,2

    0热度

    1回答

    我试图实现遗传算法将DNA片段组装成一个只给出光谱序列。我唯一的运营商是Edge Recombination,我确信它足以获得相当不错的结果。 但是......我无法击败80%(最佳分数的百分比),并且有500个碎片的实例可能需要2小时(如果在100次迭代中没有改善,算法会停止)。我甚至执行它的权利?我没有发现任何交叉运营商应该选择匹配更好的元素(片段重叠 - 在大多数论文中,它只是我们挑选的),

    0热度

    1回答

    我需要使用混乱的游戏表现,我从波斯蒂安Cigan的博客(https://bostjan-cigan.com/chaos-game-representation-of-gene-structure-in-python/) 作者这个Python代码代表许多基因序列:波斯蒂安Cigan https://bostjan-cigan.com import collections from coll

    1热度

    2回答

    我想用matplotlib绘制sequence logos。 整个代码可以在gist 有关部分是: class Scale(matplotlib.patheffects.RendererBase): def __init__(self, sx, sy=None): self._sx = sx self._sy = sy def draw_path(se

    0热度

    1回答

    假设有一个函数。该函数将字符串作为参数。 该函数是一个类的函数之一。收到一个字符串后,它会根据子字符串计算一些变量。 在该过程的一部分中,我需要将键值对附加到字典中。 这些值应该从所提到的字符串的几个部分计算,但每个char需要(在转换为int之后)被提升为2的特定幂。权力从0增加到子串结尾。 我怕我不知道如何解决提高电源的两个incementation部分: self.topologia = {