我有几个文本文件与目录中的单一列。我必须通过删除重复的行将它们合并成一个文本文件。 我正在用下面的代码。但是,我的文本文件非常大。那么做到最好和最快的方式是什么?最快的方式来结合几个文本文件没有重复的行
import os, glob
files = glob.glob('*.txt')
with open('combinedfile.txt','w') as fo:
all_lines = []
for f in files:
with open(f,'r') as fi:
all_lines.append(fi.read())
all_lines = set(all_lines)
for item in all_lines:
fo.write(item + '\n')
我正在使用Python 2.7 – Borys 2014-11-08 16:52:24