2016-07-14 72 views
0
df: 

-----------+ 
|  word| 
+-----------+ 
|  1609| 
|   | 
|  the| 
| sonnets| 
|   | 
|   by| 
| william| 
|shakespeare| 
|   | 
|   fg| 

这是我的数据框。如何使用'where'子句删除空行(删除包含''的行)。'where'in apache spark

code: 

df.where(trim(df.word) == "").show() 

output: 

----+ 
|word| 
+----+ 
| | 
| | 
| | 
| | 
| | 
| | 
| | 
| | 
| | 

任何帮助表示赞赏。

回答

1

您可以修剪和检查,如果结果为空:

>>> from pyspark.sql.functions import trim 
>>> df.where(trim(df.word) != "") 
+0

感谢的时间。该解决方案不起作用。它使数据框中的所有行都为空。我会更新问题部分以显示结果。 –

+0

对不起,操作员输入错误。 – 2016-07-14 15:47:11

+0

感谢它的工作。 –