2016-03-02 45 views

回答

26

您可以使用contains(这可与任意顺序):

df.filter($"foo".contains("bar")) 

like(SQL像SQL简单的正则表达式蒙山_匹配任意字符和%匹配任意顺序):

df.filter($"foo".like("bar")) 

rlike(像Java regular expressions):

df.filter($"foo".rlike("bar")) 

根据您的要求。 LIKERLIKE也应该使用SQL表达式。

+0

是上面的scala代码吗?看起来像scala不喜欢$符号。我导入了'import org.apache.spark.sql.functions.lit' –

+6

Scala。为了使'$'工作,你需要'import sqlContext.implicits._'。你可以用'df(“foo”)''或'org.apache.spark.sql.functions.col(“foo”)'替换它。 – zero323

+0

太棒了!非常感谢 –

相关问题