我有一个数据框,有一些列,在进行分析之前,我想了解这个数据框是多完整的,所以我想过滤数据框并为每列计算非空值的数量,可能会返回一个数据帧。计算Spark DataFrame中非空值的数目
基本上,我想实现在this question表达了同样的结果,但使用Scala的,而不是Python的...
假设你有:
val row = Row("x", "y", "z")
val df = sc.parallelize(Seq(row(0, 4, 3), row(None, 3, 4), row(None, None, 5))).toDF()
你怎么能概括的非数 - 对于每一列都是空的,并且返回一个具有相同列数的数据框,并且只有一行包含答案?
非常感谢万亩如果你能分享一些片段来更好地理解你提出的逻辑,我会很感激的:我可以编写一个UDF来做到这一点,但我没有得到如何编写一个代码来执行每列的UDF – user299791