1
我是Spark Streaming的新手。我不知道下面的代码之间的区别:火花流多输入kafka dstreams混淆
答:
val kafkaDStreams = (1 to 3).map { i =>
KafkaUtils.createStream[String, String, StringDecoder, StringDecoder](ssc, kafkaParams,
topicsMap, StorageLevel.MEMORY_AND_DISK_SER)
.map(_._2)
}
ssc.union(kafkaDStreams).foreachRDD(......)
B:
val kafkaDStreams = (1 to 3).map { i =>
KafkaUtils.createStream[String, String, StringDecoder, StringDecoder](ssc, kafkaParams,
topicsMap, StorageLevel.MEMORY_AND_DISK_SER)
.map(_._2).foreachRDD(......)
}
什么时候,以星火流应用程序执行的2个样品之间的差异。任何帮助?谢谢!
感谢您的回复,Philip 。正如你所说,在第二个例子中,有三个独立的进程并行进行**,那么如果集群资源足够,第二个代码示例将具有更好的性能。那么这两者的用例是什么? –