fasta

    3热度

    2回答

    我有这样的一个测试这里FASTA文件: >HWI-D00196:168:C66U5ANXX:3:1106:16404:19663 1:N:0:GCCAAT CCTAGCACCATGATTTAATGTTTCTTTTGTACGTTCTTTCTTTGGAAACTGCACTTGTTGCAACCTTGCAAGCCATATAAACACATTTCAGATATAAGGCT >HWI-D00196:168:C6

    0热度

    2回答

    我打开一个目录中的文件,每个文件中包含两行序列。顶部序列比底部长,但包含底部序列。一旦在顶部序列中找到它,我想在每个方向上扩展底部序列的两个侧翼字母。我正在尝试做一个正则表达式匹配,但获取$ newsequence变量未初始化的错误。 下面是一个典型的文件看起来是这样的: >CCCCNNNNNCCCC NNNNN 我想打印一个文件中的所有序列的格式如下: >CCCCNNNNNCCCC

    0热度

    1回答

    我需要你的帮助。 我做了一个perl脚本,将multifasta文件转换为fasta文件。 例如: 在多FASTA文件包含: GI | 983431797 | REF | NZ_LN000000.1 |诺卡氏菌farcinica基因组装配NCTC11134,染色体:1 CTGACTGGGAGTACGAAGGCCGCCTGCACAAGACAACGGGGCAGCGAACCTTCTTCTGCACCGGC

    0热度

    1回答

    可能这个问题太笼统了,但我完全停留在这个。任何类型的帮助理解: 我有一个蛋白FASTA文件(protein.txt)像: >a mnspq >b rstuvw >c mnqa 注意,A,B和C蛋白的长度是5,6和4分别(总长度= 15) 我现在已经提取的一些随机范围(计算是基于总长度),并将其保存(FILE1.TXT)为: 2-3 4-10 11-14 每种蛋白的长度(总内长

    0热度

    1回答

    我有一个如下组织的长列表(INPUT)。 我想分割数据,以便我得到如下输出(所需的OUTPUT)。 下面的代码首先标识包含“> gi”的所有行,并将这些行的行数保存在一个名为B的数组中。 然后,在新文件中,应该用数组B中的行缩短版本之后的文字 我认为最简单的方法是在“|”处分割,但这不起作用(如果我用“|”替换“”,我的代码不会发生分离) 我的代码在下面,在“”之后很好地分割“”,通过“”在INP

    2热度

    1回答

    我正在执行正则表达式搜索,希望仅以fasta格式打印命中(两行数据:第一个以胡萝卜“>”开头,接着是命中,第二行没有胡萝卜,但仍包含命中信息)。 我可以成功生成一个输出multifasta文件,但输出文件中是否包含胡萝卜和换行符,无论是否存在命中。 生成的输出: > > >TAGCTAGC TAGCTAGC > >GCTAGCTA

    1热度

    1回答

    我想根据参考文本文件中的信息更改我的FASTA头。所以说,我有两个文件: FILE1.TXT(参考,制表符分隔) chr1:100-1000(+) ORF1_ORF2_ chr2:30-400(-) ORF2_ chr3:50-4500(+) chr4:60-800(-) ORF1_ file2.fasta >chr1:100-1000(+) TTTTGAGAGGACTTCTCTG

    0热度

    1回答

    我想确定multifasta文件中单个序列的长度。我得到这个biopython代码从生物手动为: from Bio import SeqIO import sys cmdargs = str(sys.argv) for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"): output_line = '%s\t%i' % \ (seq

    2热度

    3回答

    我有这样的(FASTA格式)的input_file.fa文件: > header1 description data data data >header2 description more data data data 我希望一次在文件中的一个块读取,从而使每个块包含一个头和相应的数据,例如块1: > header1 description data data data 当

    0热度

    1回答

    我有一个FASTQ文件,我可以运行FASTQC程序来分析文件。但是当我使用trim_galore时,FASTQC(或trim_galore中的FASTQC选项)不再有效。 $ fastqc ./sub1_val_1.fq.gz 这是输出: Started analysis of sub1_val_1.fq.gz Analysis complete for sub1_val_1.fq.gz