如果你的空白总是在第一那么Marius的回答是最简单的。如果您在开始处有空白,或者您只想跳过一些行数,则可以使用itertools.islice()
。
跳到第N行
假设你要跳过第一4
行(空行或不):
from itertools import islice
with open('csv2.csv', 'r') as f1, open('out.csv', 'w') as out:
filt_f1 = islice(f1, 4, None)
r1 = csv.reader(filt_f1)
wr = csv.writer(out)
for line in r1:
...
空白行整个
如果你有空白行散布在整个文件中,然后您可以使用itertools.filterfalse
将其过滤掉。
import csv
from itertools import filterfalse
from itertools import chain
with open('csv1.csv', 'r') as f1, open('csv2.csv', 'r') as f2, open('out.csv', 'w') as out:
# create an iterator without lines that start with '\n'
filt_f1 = filterfalse(lambda line: line.startswith('\n'), f1)
filt_f2 = filterfalse(lambda line: line.startswith('\n'), f2)
# csv.reader consumes the filtered iterators
r1, r2 = csv.reader(filt_f1), csv.reader(filt_f2)
wr = csv.writer(out)
# here insert your logic, I just write both to the same file
for line in chain(r1, r2):
wr.writerow(line)
其中csv1.csv是:
time,name,location
12345,Jean,Montreal
12346,Peter,Chicago
1234589,Doug,Boston
和csv2.csv(注:这里没有显示,但在文件的顶部csv2.csv有4个空行):
123457,Scott,San Diego
123458,Jen,Miami
123459,Robert,Sacramento
输出out.csv没有空行遍布:
time,name,location
12345,Jean,Montreal
12346,Peter,Chicago
1234589,Doug,Boston
123457,Scott,San Diego
123458,Jen,Miami
123459,Robert,Sacramento
你的csv文件实际上是什么样子的?你能编辑几行例子,包括空行吗?另外,你得到的具体错误是什么,Python是否会引发异常,或者你只是没有得到你想要的结果? – Marius
csv的第一行是空行。我得到的错误是IndexError:列表索引超出范围。如果我手动删除第一个空白行并运行,我没有得到任何错误。 –