我有100个XLS文件,我想合并成一个CSV文件。有没有办法提高将它们结合在一起的速度?有没有办法将熊猫的追加方法并行化?
这与使用Concat的问题是,它缺乏论据to_csv得到我:
listOfFiles = glob.glob(file_location)
frame = pd.DataFrame()
for idx, a_file in enumerate(listOfFiles):
print a_file
data = pd.read_excel(a_file, sheetname=0, skiprows=range(1,2), header=1)
frame = frame.append(data)
# Save to CSV..
print frame.info()
frame.to_csv(output_dir, index=False, encoding='utf-8', date_format="%Y-%m-%d")