fasta

3热度

2回答

我有这样的一个测试这里FASTA文件： >HWI-D00196:168:C66U5ANXX:3:1106:16404:19663 1:N:0:GCCAAT CCTAGCACCATGATTTAATGTTTCTTTTGTACGTTCTTTCTTTGGAAACTGCACTTGTTGCAACCTTGCAAGCCATATAAACACATTTCAGATATAAGGCT >HWI-D00196:168:C6

0热度

2回答

分配正则表达式搜索到变量：未初始化的变量错误

我打开一个目录中的文件，每个文件中包含两行序列。顶部序列比底部长，但包含底部序列。一旦在顶部序列中找到它，我想在每个方向上扩展底部序列的两个侧翼字母。我正在尝试做一个正则表达式匹配，但获取$ newsequence变量未初始化的错误。下面是一个典型的文件看起来是这样的： >CCCCNNNNNCCCC NNNNN 我想打印一个文件中的所有序列的格式如下： >CCCCNNNNNCCCC

0热度

1回答

我该如何生成一个fasta文件，只有在perl文件multifasta头部中的引用和病毒名称

我需要你的帮助。我做了一个perl脚本，将multifasta文件转换为fasta文件。例如：在多FASTA文件包含： GI | 983431797 | REF | NZ_LN000000.1 |诺卡氏菌farcinica基因组装配NCTC11134，染色体：1 CTGACTGGGAGTACGAAGGCCGCCTGCACAAGACAACGGGGCAGCGAACCTTCTTCTGCACCGGC

0热度

1回答

从连接的fasta文件中，如何找到每个蛋白质序列中的个别位置范围

可能这个问题太笼统了，但我完全停留在这个。任何类型的帮助理解：我有一个蛋白FASTA文件（protein.txt）像： >a mnspq >b rstuvw >c mnqa 注意，A，B和C蛋白的长度是5,6和4分别（总长度= 15）我现在已经提取的一些随机范围（计算是基于总长度），并将其保存（FILE1.TXT）为： 2-3 4-10 11-14 每种蛋白的长度（总内长

0热度

1回答

unix使用循环，awk和拆分拆分FASTA

我有一个如下组织的长列表（INPUT）。我想分割数据，以便我得到如下输出（所需的OUTPUT）。下面的代码首先标识包含“> gi”的所有行，并将这些行的行数保存在一个名为B的数组中。然后，在新文件中，应该用数组B中的行缩短版本之后的文字我认为最简单的方法是在“|”处分割，但这不起作用（如果我用“|”替换“”，我的代码不会发生分离）我的代码在下面，在“”之后很好地分割“”，通过“”在INP

2热度

1回答

从阵列中删除空白正则表达式

我正在执行正则表达式搜索，希望仅以fasta格式打印命中（两行数据：第一个以胡萝卜“>”开头，接着是命中，第二行没有胡萝卜，但仍包含命中信息）。我可以成功生成一个输出multifasta文件，但输出文件中是否包含胡萝卜和换行符，无论是否存在命中。生成的输出： > > >TAGCTAGC TAGCTAGC > >GCTAGCTA

1热度

1回答

比较两个文件（fasta和txt），如果匹配，然后将前缀fasta头与txt文件的值

我想根据参考文本文件中的信息更改我的FASTA头。所以说，我有两个文件： FILE1.TXT（参考，制表符分隔） chr1:100-1000(+) ORF1_ORF2_ chr2:30-400(-) ORF2_ chr3:50-4500(+) chr4:60-800(-) ORF1_ file2.fasta >chr1:100-1000(+) TTTTGAGAGGACTTCTCTG

0热度

1回答

在添加前面序列的长度后计算序列的长度

我想确定multifasta文件中单个序列的长度。我得到这个biopython代码从生物手动为： from Bio import SeqIO import sys cmdargs = str(sys.argv) for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"): output_line = '%s\t%i' % \ (seq

2热度

3回答

阅读使用指定的分隔符在Python

我有这样的（FASTA格式）的input_file.fa文件： > header1 description data data data >header2 description more data data data 我希望一次在文件中的一个块读取，从而使每个块包含一个头和相应的数据，例如块1： > header1 description data data data 当

0热度

1回答

为什么FastQC在使用Trim之后不工作？

我有一个FASTQ文件，我可以运行FASTQC程序来分析文件。但是当我使用trim_galore时，FASTQC（或trim_galore中的FASTQC选项）不再有效。 $ fastqc ./sub1_val_1.fq.gz 这是输出： Started analysis of sub1_val_1.fq.gz Analysis complete for sub1_val_1.fq.gz