2016-10-20 124 views
0

我试图计算在下面秒的时间差是我的尝试,以秒计算pyspark持续时间

from datetime import datetime 
aa = sc.parallelize[('10:40:31', '10:39:31')] 
FMT = "%H:%M:%S" 
duration = aa.map(lambda p: (datetime.strptime(p[0], FMT) - datetime.strptime(p[1], FMT))) 

给我[datetime.timedelta(0,60),但我想秒钟差只有60只。

我怎么能这样做,我试图用.total_seconds(),但它不工作

回答

0

解决这个问题,

我需要添加更多的地图.seconds

duration = aa.map(lambda p: (datetime.strptime(p[0], FMT) - datetime.strptime(p[1], FMT))).map(lambda l: l.seconds) 

将给,

[60]