2
我使用Spark 2.1和Python 2.7.12。如何用DataFrame中的具体时间戳填充没有值?
假设如下:
from pyspark.sql.functions import *
import timestamp
data = [Row(time=datetime.datetime(2017, 1, 1, 0, 0, 0, 0)), Row (time=datetime.datetime(1980, 1, 1, 0, 0, 0, 0)), Row(time=None) ]
df = spark.createDataFrame(data)
如何使用df.fillna({'time': datetime.datetime(1980, 1, 1, 0, 0, 0, 0)})
填写null
值/ s的具体时间?