fasta

    -1热度

    1回答

    感谢您的帮助。我想提取具体的内含子fasta,然后合并内含子fasta和CDS fasta输出我的具体transcript.how我可以用biopython或python做到这一点? 我GFF file.example: 1 ensembl intron 7904 9192 . - . Parent=GRMZM2G059865_T01;Name=intron.71462 1 ensembl in

    2热度

    1回答

    我使用以下代码将fasta序列写入文件。 from Bio import SeqIO sequences = "KKPPLLRR" # add code here output_handle = open("example.fasta", "w") SeqIO.write(sequences, output_handle, "fasta") output_handle.close()

    1热度

    4回答

    我有什么应该是一个简单的问题,但是我缺乏awk知识让我失望。 我想清理FASTA文件,它是在这种格式的标头: >HWGG454_Clocus2_Locus3443_allele1 ATTCTACTACTACTCT >GHW757_clocus37_Locus555662_allele2 CTTCCCTACGATG >TY45_clocus23_Locus800_allele0 TTCTA

    0热度

    1回答

    我有一个FASTA文件,我使用“read.delim”到R.相应data.frame读取FASTA文件看起来像以下: >tm_sd_1256_2_1 MJAKDHRZTASDJASJDKASJDURUJDFLSDJFSDIFJKSDFKSJDFLJSDLFD ASDJASDJ >tm_sd_5672_1_2 AIZZTQBCSKLKDSHDADBCMSJHKQUWIRJHJJKKDLJSG

    0热度

    1回答

    第9行显示错误“列表分配索引超出范围” 我必须获取具有最大gc内容的密钥并打印gc内容值与关键一起。 这只是我正在做的一个示例,而问题可能包含2个以上的序列。 d={"fff":'TTAGCCGAATTTGGC',"ddd":'TGATACTAGCGTAG'} b=[] a=[] i=0 for key in d: h=len(d[key]) t=d[key].coun

    0热度

    1回答

    我想用一个简单的例子使用这个脚本(vcf-consensus),但我有一个错误:在fasta文件中找不到序列“7”。 的构造结是: Usage: cat ref.fa | vcf-consensus [OPTIONS] in.vcf.gz > out.fa 我FASTA文件是: TGGCTGGAACGGGACCTCACATTCTGTATTTGTCCCGATTGGCTAGCAACTTAGAACT

    0热度

    1回答

    我有一个问题,我似乎无法找到并修复。 FASTA = >header1 ATCGATCGATCCCGATCGACATCAGCATCGACTAC ATCGACTCAAGCATCAGCTACGACTCGACTGACTACGACTCGCT >header2 ATCGATCGCATCGACTACGACTACGACTACGCTTCGTATCAGCATCAGCT

    -1热度

    2回答

    人类基因组由24条不同的染色体组成(实际上23对= 46条染色体)。该染色体称为1,2,3,...,22,X和Y。每个染色体是一个非常长的字符串(例如染色体1由近24,000,000个字符组成),其中'G','C','A'和'T'字符(例如染色体1)是非常长的字符串。我有一个文件中的每个染色体(染色体1的链是在1.fa文件中)。 *.fa文件被称为fasta文件,它是DNA链信息的标准文件。此文件

    3热度

    1回答

    我试图将几行字母折叠为一行。 例 >8445125 VSSSDEQPRPRRS RNQDRQHPNQNRP VLGRTERDRNRRQ FGQNFLRDRKTIA >8445125 VSSSDEQPRPRRSRNQDRQHPNQNRPVLGRTERDRNRRQFGQNFLRDRKTIA 我试图正则表达式查找[A-Z] \ n上与空白替换。问题是它会删除每行结尾的S,P Q和A.

    0热度

    2回答

    我有一个fasta file_imagine作为txt文件,其中偶数行是字符序列,奇数行是序列id's_我想要搜索串中的字符串并获取匹配子字符串以及它们的ID的位置。示例: 输入: >111 AACCTTGG >222 CTTCCAACC >333 AATCG 搜索“CC”。输出: 3 111 4 8 222