0
我正在使用Spark流(在java中)使用来自Kafka的消息。我已经在rdd上做了一些处理。现在,我应该把这个处理过的信息(字符串)写到s3上的一个文件中。我如何实现这一目标?在火花传输中写入处理文件
directKafkaStream.map(message -> recordInjection.invert(message._2).get()).foreachRDD(rdd -> {
rdd.foreach(record -> {
// processing each record, storing the processed info in a string.
// write each processed record (string) to s3
});
});
猜测唯一的方法是用map函数形成一个rdd然后写入s3。 – RED