2016-07-28 59 views
0

假设我有一个由元组$(t,q)$组成的数据流,其中$ t $是感兴趣的变量。是否有一种分布式方法来跟踪最大$ t $的元组?当$ t $高于全局最大值时才发射?Apache Flink - 保持最大值

问候, 凯文

回答

1

你有没有考虑弗林克的状态功能? (https://ci.apache.org/projects/flink/flink-docs-release-1.0/apis/streaming/state.html

我是Flink myselfe的新手,但我认为它提供了您正在寻找的功能。

+0

谢谢!是的,但我认为是分享国家。这意味着如果状态变得越来越大,将会产生很多网络流量来维持状态。我现在正在研究'coGroup',也许有可能? –

+1

据我所知,状态总是本地的TaskManager。但是如果你键入你的流,那么具有相同键的流的部分总是到达同一个TaskManager。 但我认为这不是你想要/可以对你的数据做什么!? – Claudi

+0

不,我不得不加入/组合它们,所以我需要维护一个全局状态(这不会有效)。 –