我有一个非常模块化的代码库,其中包含许多函数。其中一些函数产生相当大的数据帧,我使用to_csv()保存到磁盘,然后直接将数据帧返回到调用函数。返回数据帧vs写入磁盘并从磁盘读取csv的效率
编辑更好地说明问题,使用从@ ysearka的回答样本功能
这是我目前在做什么:
def my_func(some_input):
#df = something(some_input)
return dataframe
df = my_func(my_input)
另一种方法,我认为是来读取文件磁盘写操作之后的通话功能已经完成:
def my_func(some_input):
#df = something(some_input)
df.to_csv('my_file_name.csv')
df = pd.read_csv('my_file_name.csv')
我的问题是:哪以上是实现这一目标的更有效方法吗?
- 返回数据框来调用函数?
- 写入完成后,从调用函数中的磁盘读取文件。
你能解释你想达到什么吗?一个小环境会有所帮助。 –
我编辑了我的答案,但由于我们不知道你在数据框之后想要做什么,所以我不能做得更好。 – ysearka