我正在尝试整合Spark/Kafka来构建流媒体应用程序。 Kakfa版本:0.9 spark:1.6.2SparkStreaming/Kafka胶印处理
如何处理RDD批处理数据后的偏移量。
你能否给我更多关于处理偏移量的见解?
火花内置了自动存储和读取偏移吗?还是我需要引导火花来读取某些商店(如mongo或oracle)的偏移量?
JavaInputDStream<String> directKafkaStream = KafkaUtils.createDirectStream(jsc, String.class, String.class,
StringDecoder.class, StringDecoder.class, String.class, kafkaParams, topicMap,
(Function<MessageAndMetadata<String, String>, String>) MessageAndMetadata::message);
directKafkaStream.foreachRDD(rdd -> {
这个答案是非常广泛的,更超过它只是火花文档的副本! – avr