2016-12-26 45 views

回答

-1

基于时间戳的Spark Streaming进程文件,即只有那些在火花流开始之后被添加到特定路径的文件被处理。 Spark流不处理在流上下文开始之前放置的文件。

简单地说,流式处理不在旧数据上的实时数据。