简单的问题一个文本文件: 对于以下RDD我要打印输出的文本文件格式如下和头(用户ID,MovieID,Pred_rating)打印RDD与头
scala> final_predictions_adjusted.sortByKey().first
res61: ((Int, Int), Double) = ((1,1172),1.8697903970770442)
够简单。对?所以我用这个函数:
def print_outputfile(final_predictions_adjusted:RDD[((Int, Int), Double)])={
val writer = new FileWriter(new File("output.txt"))
writer.write("UserID,MovieID,Pred_rating")
final_predictions_adjusted.sortByKey().foreach(x=>{writer.write(x.toString())})
writer.close()
}
上述功能不与下面的错误
caused by: java.io.NotSerializableException: java.io.FileWrite
'collect'结果将只在驱动程序中。好的,只要结果足够小以适应那里,但不适用于大数据集 –