2016-11-24 28 views
-1

我有一个Spark SQL DataFrame与几列,但我想添加一些静态值的DataFrame中更多的列。我怎样才能做到这一点?如何使用一些静态值在DataFrame中添加列?

我试过withColumn方法,但其预计Column

所预期的那样:

df.withColumn(col("newColumn", "static value") 

更新:

我得到了答案,我们需要使用​​3210用于此目的。

例如:

df.withColumn("newColumn", lit("some value") 

回答

1

你可以把它简单地使用UDF这样你就可以定义UDF其返回默认值,然后添加列并设置为默认值如下

val defaultValue=spark.udf.register("defaultValue",()=>"default") 

df.withColumn(col("newColumn", defaultValue) 

df.show() 
创建
相关问题