-1
Spark-cassandra-connector-java和Spark SQL DataFrame apis中使用Spark 1.5.1,筛选出长度小于或大于给定长度的字符串列的最佳方法是什么?如何根据列的长度减少/过滤Spark DataFrame(Java)中的列?
我试图做这样的事情
DataFrame df = context.sql("select key from mytable where key is not null")
DataFrame fdf = df.filter(functions.length(df.col("key").gt(10))))
如何进行的functions.length(列)API的工作?它需要一个Column并返回一个Column,但是长度会发生什么?
谢谢。这非常有帮助。我在这个[link] {https://docs.datastax.com/en/datastax_enterprise/4.8/datastax_enterprise/spark/sparkSqlSupportedSyntax.html}处提到了DataStax文档,并没有看到那里列出的LENGTH关键字/函数。两种方法都可以工作,但我已经简化了这篇文章的例子,所以我需要使用的是带有过滤器功能的例子。 – Joe