我在一个文件夹中有5个csv文件,在这里我想将每个csv文件中的所有列合并到一个数据框中。当我只加入2个csv文件时,效果很好,但是当我想加入5个csv文件时,我遇到了一个错误。我的代码如下如下:使用熊猫在一个文件夹中加入多个csv文件[MemoryError:]
In [7]:
import pandas
import os
import numpy as np
import glob
path =r'D:/PreprocessingITRC/output/All/'
allFiles = glob.glob(path + "/*.csv")
dataframe = pandas.DataFrame()
for file in allFiles:
df = pandas.read_csv(os.path.join(file),index_col=0, header=0)
dataframe = dataframe.join(df, how='right')
dataframe
---------------------------------------------------------------------------
MemoryError Traceback (most recent call last)
错误似乎很明显,文件有多大? –
你能解释一下这5个dfs之间的关系吗?它们是行式还是列式大型数据示例的一部分?在这种情况下,它可能工作,如果你只是一个列表添加每个df到这个列表,然后调用'pd.concat(df_list)' – EdChum
@PadraicCunningham总大小只有9 KB –