2017-03-14 62 views
0

从数据摘录:简单的方法来从文本中提取日期熊猫

Givent大熊猫数据框的下面的例子:

df = 
     index    date 
     7838  2012 January 
     7790  2012 January 
     7853 2015 September 
     7889  2016 March 
     7928  2015 October 
     7847  1999 January 
     7884  2006 January 
     7826  1992 January 

是否有免费的文本转换成一个简单的(和Python的)方式一个标准的日期时间变量?例如:

df = 
      index    date 
      7838  2012-01-01 
      7790  2012-01-01 
      7853  2015-09-01 
      7889  2016-03-01 
      7928  2015-10-01 
      7847  1999-01-01 
      7884  2006-01-01 
      7826  1992-01-01 

回答

2

使用pd.to_datetime()将文本转换为日期类型。您可以从list中收集适当的日期类型。

df['date'] = pd.to_datetime(df['date'], format='%Y %B') 
2

to_datetime处理这个罚款没有任何具体的格式说明:

In [83]: 
pd.to_datetime(df['date']) 

Out[83]: 
0 2012-01-01 
1 2012-01-01 
2 2015-09-01 
3 2016-03-01 
4 2015-10-01 
5 1999-01-01 
6 2006-01-01 
7 1992-01-01 
Name: date, dtype: datetime64[ns]