1
本书中的红色火花在行动如下:Spark用于异步更新。
“Spark不适合用于共享数据的异步更新(例如,在线事务处理),因为它是用批量创建的(Spark流只是在一个时间窗口中将数据应用于批量分析),专门用于这些用例的工具仍然是必需的。“
有人可以解释是它的意思吗?
我有兴趣使用火花来执行一些ETL过程。作为一个便笺,我打算在中间使用卡夫卡。虽然我不明白这个问题。因为从卡夫卡获取数据并将其写入数据库会有些相同的问题。这将平行完成。