无论数据量有多大,一个批处理间隔的数据是否只生成DStream中的一个且只有一个 RDD?DStream为批处理间隔生成多少个RDD?
10
A
回答
8
是的,每个批处理间隔只有一个RDD,在每个批处理间隔产生,与记录数无关(包含在RDD中 - 内部可能有零个记录)。
如果没有,并且RDD创建以元素数为条件,则不会有同步(微批处理)流,而是一种异步处理的形式。
0
在Spark Streaming Programming Guide - Discretized Streams (DStreams),有:
每个RDD在DSTREAM含有一定的间隔数据
相关问题
- 1. DStream的RDD是否一次性为整批间隔创建整个数据?
- 2. Spark将一个DStream分成几个RDD
- 3. 向DStream中的批量RDD添加新元素RDD
- 4. 获取批处理间隔的时间
- 5. Spark Streaming - 批处理间隔与处理时间
- 6. Spring批处理 - 使用多个字符作为分隔符
- 7. Spark Streaming DStream元素vs RDD
- 8. SleepEx期间处理多少个APC?
- 9. 跟踪我们在生成器中处理多少个元素
- 10. 在apache-spark RDD中处理多个'行'
- 11. 用于kafka主题后处理的spark-streaming批处理间隔
- 12. 生成一个批处理文件%*作为参数的
- 13. Spark中的RDD和批处理之间的区别?
- 14. DStream中的列表处理
- 15. spring批处理和jrecord生成ebcedic
- 16. 批处理 - 生成文件名
- 17. 批处理文件生成文件
- 18. 多个批处理命令
- 19. 创建一个批处理以启动多个批处理
- 20. 执行多个批处理文件后,同时完成批处理文件
- 21. 为pyspark生成单个json文件RDD
- 22. 以5秒为间隔生成时间
- 23. 动态处理多个批处理文件并使用Spring批生成相应的输出文件
- 24. 如何在Spark Streaming中的多个批处理间隔中传输数据流
- 25. 使用NServiceBus如何处理多个消息作为批处理?
- 26. 如何将RDT数量的DStream转换为单个RDD
- 27. C#控制台调用批处理多个批处理文件
- 28. Spring批处理 - 如何生成一个批处理作业的输出文件作为excel表
- 29. 如何让每个示例在Tensorflow中生成多个批处理条目?
- 30. spring批处理框架需要多少个jdbc连接