2016-04-11 58 views
0

我们在1个nimbus节点+4个监控节点的集群上使用apache-storm-0.9.6。apache风暴拓扑ID从n跳到n + 2

在本周末,名为fetcher-10-1459843589的拓扑突然停止处理任何消息。这是ACTIVE,一切似乎都正常运行,但没有处理数据。

最后,我们手动重新启动拓扑。新拓扑名为fetcher-12-1460363279。它运行正常,它处理数据。

问题 - > 我们不明白,为什么我们从提取器-10 -...一步提取器-12 -...哪里可以获取11 -...?

其实我们并不了解很多东西,但我们希望这能帮助我们:)。我们真正想要找到的是为什么我们得到这些冻结状态,当拓扑为ACTIVE,没有报告的异常,并且没有处理数据。

请注意风暴是在码头上启动的。如果您需要更多信息,请告诉我。我将编辑这篇文章。

谢谢

回答

0

我想我找到了答案。

在集群中可能有更多的拓扑正在运行。

A,B,C,D是在同一集群中运行的4个拓扑结构。这是我的情况。当您启动拓扑时,他们将为每个拓扑分配个连续数字,但每个分组(这是我的错误)。因此,我们开始:

如果重新启动C,你必须

C-5... 

那么,是C-4?它根本不存在,因为4已被D拍摄。

因此,从n yo n+2跳过是正常的。您可能会发现n+1分配给另一个拓扑。 (q.e.d.)