我知道Spark Spark使用微量批处理数据,但在某些情况下,处理时间不到一秒钟。我的问题是“不能把它称为纯实时处理,而不是在那个实验室里进行实时处理?”为什么火花流被称为接近实时?
0
A
回答
1
我想说,我们只能在收集数据并将其直接推送到仪表板或系统时进行实时指标,警报和优化,而无需任何ETL过程,实时目的是,主要是速度。
每当有批次的流程提取历史趋势或基准时,尽管时间不到一秒,但不是实时的,而是接近它,这是因为他们谈论的是接近实时的。
所以,要回答你的问题,我会说不,因为你正在进行配料和加工,所以接近实时。
我希望它有帮助。
涓
1
火花流将所述数据流分成的X秒批次称为Dstreams,其内部是RDDS,一个用于每批间隔的序列。每个RDD都包含在批处理间隔期间收到的记录,因为其小批量处理过程几乎不实时。
+0
谢谢@vaquarkhan – dalonlobo
相关问题
- 1. 为什么火花
- 2. 什么是在火花流
- 3. 为什么我只能看到一个火花流kafkaReceiver
- 4. 为什么火花击杀任务?
- 5. 什么时候gc被称为
- 6. 火花流
- 7. 火花流update_state_by_keys
- 8. 火花流
- 9. 为什么jQuery被称为jQuery?名称的原因是什么?
- 10. 为什么运行简单的火花流很难?火花1.1.1 Maven依赖关系
- 11. 为什么argsort被称为argsort?
- 12. 为什么SP-Initiated被称为SSO?
- 13. 为什么cookies被称为“cookies”?
- 14. 为什么密码盐被称为“盐”?
- 15. 为什么Method#arity被称为“arity”?
- 16. 为什么cc1被称为cc1?
- 17. 为什么AJAX被称为异步?
- 18. 为什么Common Table Expression被称为“Common”?
- 19. 为什么mojolicious行动不被称为?
- 20. 为什么9patch被称为9patch
- 21. 为什么'Select'被称为DML语句?
- 22. 火花为什么列更改为可空
- 23. 更接近HTML ...那么为什么HtmlHelper?
- 24. Silverlight:为什么XAP被称为XAP,为什么不是其他?
- 25. 火花流聚合
- 26. 使用火花流
- 27. 使用火花流
- 28. 火花流文件流
- 29. 火花流功能通过异常火花提交时间
- 30. 火花 - 为什么火花工作持续时间不等于每个阶段持续时间的总和?
谢谢@Juan,它清除了疑问 – dalonlobo
我刚刚问过我们的大数据专家(他在我的右侧工作),他说大数据Spark Streaming被认为是近实时的,因为他的精度接近于毫秒以及Storm等框架或新的Spark(结构化流媒体),您可以以毫微秒的精度工作,这是大数据中的纯粹主义者所称的实时。 – Juan