我想使用结构化流式传输将文本文件附加到文本文件中。此代码导致SparkException:任务不可序列化。我认为toDF是不允许的。我怎么能得到这个代码工作?使用foreach附加到文本文件的Spark结构化流式传输
df.writeStream
.foreach(new ForeachWriter[Row] {
override def open(partitionId: Long, version: Long): Boolean = {
true
}
override def process(row: Row): Unit = {
val df = Seq(row.getString(0)).toDF
df.write.format("text").mode("append").save(output)
}
override def close(errorOrNull: Throwable): Unit = {
}
}).start
我想你应该试试这个 df.write.mode(SaveMode.Append).textFile(“Path_To_Store”) –
编译器抱怨文本文件不是成员DataFramerWriter。我正在使用spark 2.1。 –
对不起,它只有'文本(“Path_To_Save”)' 'df.write.mode(SaveMode.Append).text(“Path_To_Save”)' –