2
val ordersRDD = sc.textFile("/user/cloudera/sqoop_import/orders");
val ordersRDDStatus = ordersRDD.map(rec => (rec.split(",")(3), 1));
val countOrdersStatus = ordersRDDStatus.countByKey();
val output = countOrdersStatus.map(input => input._1 + "\t" + input._2);
如何在spark-scala中保存Iterable [String]的输出到hdfs。 可迭代[字符串]如何在spark-scala中保存Iterable [String]到hdfs
注:输出中不是一个RDD(我不能使用output.saveAsTextFile(“HDFS路径”)
上面的代码工作得很好。谢谢。 – Anhata