2009-02-08 48 views
22

继我上一个问题之后,Python time to age,我现在遇到了关于时区的问题,事实证明它并不总是“+0200”。所以当strptime试图解析它时,它会抛出一个异常。Python时间到了,第2部分:时区

我想过用[:-6]或其他什么来切断+0200,但是有没有真正的方法可以用strptime做到这一点?

我使用Python 2.5.2,如果它很重要。

>>> from datetime import datetime 
>>> fmt = "%a, %d %b %Y %H:%M:%S +0200" 
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200", fmt) 
datetime.datetime(2008, 7, 22, 8, 17, 41) 
>>> datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0300", fmt) 
Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
    File "/usr/lib/python2.5/_strptime.py", line 330, in strptime 
    (data_string, format)) 
ValueError: time data did not match format: data=Tue, 22 Jul 2008 08:17:41 +0300 fmt=%a, %d %b %Y %H:%M:%S +0200 

回答

28

New in version 2.6.

For a naive object, the %z and %Z format codes are replaced by empty strings.

看起来这只是在> = 2.6中实现的,我认为你必须手动解析它。

我看不到另一种解决方案,而不是删除时区数据:

from datetime import timedelta,datetime 
try: 
    offset = int("Tue, 22 Jul 2008 08:17:41 +0300"[-5:]) 
except: 
    print "Error" 

delta = timedelta(hours = offset/100) 

fmt = "%a, %d %b %Y %H:%M:%S" 
time = datetime.strptime("Tue, 22 Jul 2008 08:17:41 +0200"[:-6], fmt) 
time -= delta 
+0

一旦感谢gs,还有大卫:) 我想我只需要切断末端,不想依赖2.6。 – Ashy 2009-02-08 23:11:31

+0

不适用于像委内瑞拉这样的时区:-0430 – chachan 2014-06-24 08:46:07

+0

@chachan:但适度调整。 – 2014-06-24 10:50:16

1

据我所知,strptime()不能识别数字时区代码。如果您知道字符串总是以该表单的时区指定结尾(+或 - 后跟4位数字),那么只需将其关闭并手动解析即可,这似乎是非常合理的做法。

0

看来%Z对应的时区名称,不偏移。

例如,给定:

>>> format = '%a, %d %b %Y %H:%M:%S %Z' 

我可以解析:

>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 GMT', format) 
datetime.datetime(2008, 7, 22, 8, 17, 41) 

虽然它似乎并没有对时区什么,只是观察它的存在和有效:

>>> datetime.datetime.strptime('Tue, 22 Jul 2008 08:17:41 NZDT', format) 
datetime.datetime(2008, 7, 22, 8, 17, 41) 

我想如果你愿意,你可以找到偏移量映射到名称,转换你的输入,然后解析它。不过,截取输入可能会更简单。

+0

%Z是名称中的时区,%z在houres中。 – 2009-02-09 12:31:16

40

is there a real way to do this with strptime?

没有,但因为你的格式看起来是一个RFC822家庭日,你可以更轻松地使用email库,而不是阅读:

>>> import email.utils 
>>> email.utils.parsedate_tz('Tue, 22 Jul 2008 08:17:41 +0200') 
(2008, 7, 22, 8, 17, 41, 0, 1, 0, 7200) 

(7200 =时区从UTC偏移秒)

18

可以使用dateutil库,这是非常有用的:

from datetime import datetime 
from dateutil.parser import parse 

dt = parse("Tue, 22 Jul 2008 08:17:41 +0200") 
## datetime.datetime(2008, 7, 22, 8, 17, 41, tzinfo=tzoffset(None, 7200)) <- dt 

print dt 
2008-07-22 08:17:41+02:00