2015-09-04 196 views
1

脱粒机 - > Bolt1 - > Bolt2 - > Bolt3 - >确认orginalID(腾出队列消息)阿帕奇风暴螺栓螺栓消息停止或者片状

的基本拓扑结构似乎几分钟,但在一些工作指出消息不会被发送或消耗,螺栓也不会被调用。我不知道java线程是否死掉,因为在日志中没有例外或者有任何错误的迹象。

Apache风暴.92或.95对我来说都有相同的结果。

我一直在为一对夫妇几年编程风暴,还从来没见过这个....

+0

您是否检查了所有拓扑,工作人员,主管和nimbus日志以查找错误消息?正如你提到“ack”作为最后一步,我假设你启用了容错功能。什么是你的“max.spout.pending”值?你在管道中是否存在瓶颈(使用Storm UI来观察是否所有的螺栓都能跟上输入元组的处理)? –

+0

@Don你确定喷口没有用完元组发出吗?如果你的某个螺栓因某种“未知异常”而崩溃,你应该能够看到元组超时失败。 –

+0

@ MatthiasJ.Sax待处理的最大喷嘴,对观察到的行为没有任何影响。只要一个元组被完全处理,另一个可以被发射。 –

回答

0

好了,因为我以前的响应得到了删除,我会只是一次重试。 我们已经看到了类似的行为,特别是在重载的情况下。原来这是由于一个缓慢的螺栓。结果,这个缓慢的过程填满了队列(通常需要几个小时),并且在某些时候,当队列大小足够高时,风暴将完全停止处理。

+0

我打算把这个标记为“不是答案”,但后来我在[help center]中注意到了这个建议](http://stackoverflow.com/help/how-to-answer):“贡献你的研究成果,以及任何你已经尝试过的部分答案”。所以,感谢您贡献您的研究。如果您发现任何其他见解,请告诉我们。 – showdev