0
已经存在的道路我能保存RDD输出到HDFS与saveAsTextFile方法。如果文件路径已经存在,此方法将引发异常。星火:保存RDD在HDFS
我有我需要保存RDDS在HDFS已经存在的文件路径的使用情况。有没有办法只是将新的RDD数据附加到已存在于同一路径中的数据?
已经存在的道路我能保存RDD输出到HDFS与saveAsTextFile方法。如果文件路径已经存在,此方法将引发异常。星火:保存RDD在HDFS
我有我需要保存RDDS在HDFS已经存在的文件路径的使用情况。有没有办法只是将新的RDD数据附加到已存在于同一路径中的数据?
一个可能的解决方案,因为星火1.6可用,是使用DataFrames
与text
格式和append
模式:
val outputPath: String = ???
rdd.map(_.toString).toDF.write.mode("append").text(outputPath)
我试了一下。但是,我得到这个例外java.lang.NoSuchMethodError:org.apache.spark.sql.DataFrameWriter.text(Ljava /朗/字符串;)V – yAsH
你使用哪种版本的火花? – zero323
糟糕。我正在使用spark版本1.5。 – yAsH