0
我有一个pyspark DataFrame,比如说df1,有多列。基于Pyspark中的列表和列创建列
我也有一个列表,比如l = ['a','b','c','d']
,这些值是DataFrame中某列中存在的值的子集。现在
,我愿做这样的事情:
df2 = df1.withColumn('new_column', expr("case when col_1 in l then 'yes' else 'no' end"))
但这是抛出以下错误:
failure: "(" expected but identifier l found.
任何想法如何解决此错误或做什么更好的办法它?
它的工作。非常感谢! :) – Hemant