是否可以监控Apache Storm发送给nimbus的心跳事件?监控Apache Storm心跳/状态::不允许
我目前遇到了一个问题,我的工人得到看似随机地重新分配,虽然我们没有看到在CPU的任何明显的峰值,内存,I/O或网络使用跨越这可能表明一个瓶颈集群。我能够监控这个的唯一方法是检查supervisor.log文件(Shutting down and clearing id xxx. Current supervisor time: 123. State: :disallowed, Heartbeat: { ... }
)和应用程序结果中的不当行为。 Storm UI中没有错误,工作日志中没有堆栈跟踪(例如内存不足或其他)。
在小型4节点集群上运行Storm 0.10,其中有〜12名工人和〜650名执行者。工人的最大JVM RAM/childopts设置为4096MiB,这不应该导致有趣的GC/GC结果。