python csv阅读器忽略空行

我使用pythons csv阅读器。我如何使用下面的代码来忽略空白行。python csv阅读器忽略空行

import csv 
f1 = open ("ted.csv") 
oldFile1 = csv.reader(f1, delimiter=',', quotechar='"') 
oldList1 = list(oldFile1) 
f2 = open ("ted2.csv") 
newFile2 = csv.reader(f2, delimiter=',', quotechar='"') 
newList2 = list(newFile2) 

f1.close() 
f2.close() 

with open("ted.csv") as f1, open("ted2.csv") as f2, open('foo.csv', 'w') as out: 
    r1, r2 = csv.reader(f1), csv.reader(f2) 
    st = set((row[0], row[3]) for row in r1) 
    wr = csv.writer(out) 
    for row in (row for row in r2 if (row[0],row[3]) not in st): 
      wr.writerow(row)

来源

2015-07-20 Michal K

你的csv文件实际上是什么样子的？你能编辑几行例子，包括空行吗？另外，你得到的具体错误是什么，Python是否会引发异常，或者你只是没有得到你想要的结果？ – Marius

csv的第一行是空行。我得到的错误是IndexError：列表索引超出范围。如果我手动删除第一个空白行并运行，我没有得到任何错误。 –

如果您的CSV文件，开始以一个空行，我想你应该可以跳过该行以readline()创建CSV读者面前：

with open("ted.csv") as f1, open("ted2.csv") as f2, open('foo.csv', 'w') as out: 
    f1.readline() 
    f2.readline() 
    r1, r2 = csv.reader(f1), csv.reader(f2)

来源

2015-07-20 04:38:43 Marius

如果你的空白总是在第一那么Marius的回答是最简单的。如果您在开始处有空白，或者您只想跳过一些行数，则可以使用itertools.islice()。

跳到第N行

假设你要跳过第一4行（空行或不）：

from itertools import islice 
with open('csv2.csv', 'r') as f1, open('out.csv', 'w') as out: 
    filt_f1 = islice(f1, 4, None) 
    r1 = csv.reader(filt_f1) 
    wr = csv.writer(out) 
    for line in r1: 
     ...

空白行整个

如果你有空白行散布在整个文件中，然后您可以使用itertools.filterfalse将其过滤掉。

import csv 
from itertools import filterfalse 
from itertools import chain 

with open('csv1.csv', 'r') as f1, open('csv2.csv', 'r') as f2, open('out.csv', 'w') as out: 
    # create an iterator without lines that start with '\n' 
    filt_f1 = filterfalse(lambda line: line.startswith('\n'), f1) 
    filt_f2 = filterfalse(lambda line: line.startswith('\n'), f2) 

    # csv.reader consumes the filtered iterators 
    r1, r2 = csv.reader(filt_f1), csv.reader(filt_f2) 
    wr = csv.writer(out) 

    # here insert your logic, I just write both to the same file 
    for line in chain(r1, r2): 
     wr.writerow(line)

其中csv1.csv是：

time,name,location 
12345,Jean,Montreal 

12346,Peter,Chicago 

1234589,Doug,Boston

和csv2.csv（注：这里没有显示，但在文件的顶部csv2.csv有4个空行）：

123457,Scott,San Diego 

123458,Jen,Miami 

123459,Robert,Sacramento

输出out.csv没有空行遍布：

time,name,location 
12345,Jean,Montreal 
12346,Peter,Chicago 
1234589,Doug,Boston 
123457,Scott,San Diego 
123458,Jen,Miami 
123459,Robert,Sacramento

来源

2015-07-20 07:14:05 Scott

python csv阅读器忽略空行

回答

相关问题