有一个这样的DF:熊猫to_datetime()函数的性能问题
Dat
10/01/2016
11/01/2014
12/02/2013
列“逸”有对象类型,所以我尝试使用to_datetime()熊猫将其切换到日期时间函数的方式:
to_datetime_rand = partial(pd.to_datetime, format='%m/%d/%Y')
df['DAT'] = df['DAT'].apply(to_datetime_rand)
一切正常,但我有性能问题,当我的DF高于20亿行。所以在这种情况下,这种方法可能会陷入困境,并且效果不佳。
pandas to_datetime()函数是否可以通过chunck进行转换,也可以通过循环进行迭代转换。
谢谢。
日期是唯一的吗?如果没有,你可以使用一个字典存储新的日期时间值和字符串,所以它不需要转换,如果它看到日期之前,另外任何原因,你不能只是'df ['DAT'] = pd.to_datetime (df ['DAT'],format ='%m /%d /%Y')'? – EdChum
绝对不要使用'.apply' –