我有一个为Pandas
设置的函数,该函数在input.csv
中运行大量行并将结果输入到Series中。然后它将该系列文字写入output.csv
。熊猫:从函数连续写入csv
但是,如果进程被中断(例如意外事件),程序将终止并且所有将进入csv的数据都将丢失。
是否有办法将数据连续写入csv,而不管函数是否完成所有行?
优选地,每次程序启动时,都会创建一个空白的output.csv
,该空白被附加到函数运行时附加。
import pandas as pd
df = pd.read_csv("read.csv")
def crawl(a):
#Create x, y
return pd.Series([x, y])
df[["Column X", "Column Y"]] = df["Column A"].apply(crawl)
df.to_csv("write.csv", index=False)
随着时间写入块并追加到csv,在第一次写入之后使用'mode ='a',header = False'。你可以 –
这个命令还有问题吗? –
你是指列的顺序?如果是这样,是的,他们需要按照一定的顺序。 – Winterflags