我有一个用户案例,我从客户端接收事件,其中一些事件在逻辑上相关(属于单个会话),并且在基于时间戳的事件之间存在明确排序。按时间戳排序的流数据聚合
现在,我想要构建一个解决方案,该解决方案应该继续聚合事件,直到按照时间戳的递增顺序接收到最后一个特定组为止。因此,如果收到的活动不按顺序进行,应该一直进行下去,直到他们收到的活动为止。然后,根据该特定组的密钥将它存储在HBase等数据存储中。
问题是此类不完整的组的数量可能会达到数百万,并且需要一些能够支持快速附加到不完整组并且保持无序接收的事件。我应该怎么做呢?
任何小洞察力都是可观的。谢谢! – ptntialunrlsd 2015-04-03 12:20:42