2017-09-25 100 views
0

用我的代码,我遍历文件并计算文件中的模式。我的代码如下python;如何将输出写入文本文件

from collections import defaultdict 
import csv, os, re 
from itertools import groupby 
import glob 


    def count_kmers(read, k): 
     counts = defaultdict(list) 
     num_kmers = len(read) - k + 1 
     for i in range(num_kmers): 
      kmer = read[i:i+k] 
      if kmer not in counts: 
       counts[kmer] = 0 
      counts[kmer] += 1 
     for item in counts: 
      return(basename, sequence, item, counts[item]) 

    for fasta_file in glob.glob('*.fasta'): 
     basename = os.path.splitext(os.path.basename(fasta_file))[0] 
     with open(fasta_file) as f_fasta: 
      for k, g in groupby(f_fasta, lambda x: x.startswith('>')): 
       if k: 
        sequence = next(g).strip('>\n') 
       else: 
        d1 = list(''.join(line.strip() for line in g)) 
        d2 = ''.join(d1) 
        complement = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A'} 
        reverse_complement = "".join(complement.get(base, base) for base in reversed(d1)) 
        d3 = list(''.join(line.strip() for line in reverse_complement)) 
        d4 = ''.join(d3) 
        d5 = (d2+d4) 
        counting = count_kmers(d5, 5) 
        with open('kmer.out', 'a') as text_file: 
         text_file.write(counting) 

而且我的输出看起来像这样

1035 1 GAGGA 2 
1035 1 CGCAT 1 
1035 1 TCCCG 1 
1035 1 CTCAT 2 
1035 1 CCTGG 2 
1035 1 GTCCA 1 
1035 1 CATGG 1 
1035 1 TAGCC 2 
1035 1 GCTGC 7 
1035 1 TGCAT 1 

的代码工作正常,但我不能写我的输出到文件。我得到以下错误:

TypeError         Traceback (most recent call last) 
<ipython-input-190-89e3487da562> in <module>() 
    37     counting = count_kmers(d5, 5) 
    38     with open('kmer.out', 'w') as text_file: 
---> 39      text_file.write(counting) 

TypeError: write() argument must be str, not tuple 

什么我做错了,我怎么能解决这个问题,以确保我的代码输出写入到一个txt文件?

+1

你不会从你的函数返回任何东西,只是将东西打印到屏幕上。如果没有显式的'return'语句,Python函数会返回'None',这就是'count = count_kmers(d5,5)'会做的事情,而当您尝试'''“.join(None)时,您会得到该错误 –

+0

我改变了我的代码(使用返回而不是打印),但我得到的错误,我的写参数必须是str而不是元组? – Gravel

+0

似乎是一个非常简单的错误调试,然后... –

回答

5

原始版本count_kmers()不包含return声明,这意味着它有一个隐含的return None

当您将此分配给counting时,您的所有错误都变得不言自明。

您的编辑后,函数的末尾是这样的:

for item in counts: 
    return(basename, sequence, item, counts[item]) 

它会返回四个值的元组。它也会在第一次通过循环时退出函数。

+0

我改变了我的代码(使用返回而不是打印),但比我得到的错误是我的写参数必须是str而不是元组? – Gravel

+0

因为你现在正在返回一个'tuple' - 并且你在循环的第一遍时退出 – kdopen

相关问题