1
我正在学习使用“学习火花流媒体”一书的火花流媒体。在本书中,我在关于Dstream,RDD,块/分区的部分中找到以下内容。学习火花流媒体
最后,在此架构掩盖了一个重要的一点是,接收器接口也具有连接到递送的数据段的集合(认为阵列)数据源的选项。例如,这在一些反序列化应用中特别重要。在这种情况下,Receiver不会经历块间隔等待处理将数据分割成分区,而是认为整个集合反映了将数据分割成块,并为集合的每个元素创建一个块。该操作对数据生产者部分要求很高,因为它要求以块间隔与批间隔的比例生产块以可靠地运行(在每批中提供正确数量的块)。但有些人已经发现它可以提供卓越的性能,提供了一个能够快速生成许多可用于序列化的块的实现。
我一直在打我的头,不能简单地理解作者在说什么,虽然我觉得我应该理解它。有人能给我一些指示吗?
谢谢你,我明白了。但是可以澄清:“这在某些反序列化用途中特别重要”,可以给出例如 – MaatDeamon