2016-07-29 74 views
0

已经存在的道路我能保存RDD输出到HDFS与saveAsTextFile方法。如果文件路径已经存在,此方法将引发异常。星火:保存RDD在HDFS

我有我需要保存RDDS在HDFS已经存在的文件路径的使用情况。有没有办法只是将新的RDD数据附加到已存在于同一路径中的数据?

回答

5

一个可能的解决方案,因为星火1.6可用,是使用DataFramestext格式和append模式:

val outputPath: String = ??? 

rdd.map(_.toString).toDF.write.mode("append").text(outputPath) 
+0

我试了一下。但是,我得到这个例外java.lang.NoSuchMethodError:org.apache.spark.sql.DataFrameWriter.text(Ljava /朗/字符串;)V – yAsH

+0

你使用哪种版本的火花? – zero323

+0

糟糕。我正在使用spark版本1.5。 – yAsH