0
我有Python 3.4与熊猫0.17。我注意到我的程序需要30秒才能读取一个pickle文件。熊猫read_pickle缓慢
df= pd.read_csv(a, skiprows=[1])
df.to_pickle(b)
df2 = pd.read_pickle(b) --- This line takes almost 30 seconds.
原始csv文件是〜185 MB(2967000行),pickle文件是125 MB。
我有另一个泡菜文件(〜95 MB),它工作正常(可在<秒内读取)。有什么建议么?
它可以交换吗?如果你将它读入同一个变量,需要多长时间:'df = pd.read_pickle(b)'而不是'df2'? – MaxU
我的代码片段中的最后一行实际上是在一个不同的程序中(行#1,2 - file1.py和行#3 - file2.py)。但是我反复尝试了你的建议,并没有帮助。 – jincept