2016-08-12 33 views
0

我有一个HPC集群,我想用Icinga2来监控它的健康状况。我为集群中的每个节点定义了一些检查,但是如果超过一定百分比的节点生病,我真的很想得到一个通知。Icinga2检查多个主机

我注意到可以定义一个虚拟主机,它代表集群并使用Icinga域特定语言来实现我感兴趣的事情(http://docs.icinga.org/icinga2/latest/doc/module/icinga2/chapter/advanced-topics?highlight-search=up_count#access-object-attributes-at-runtime)。然而,这看起来像是一个不合时宜的尴尬解决方案。

是否可以在主机组上定义这种“聚合”或“元检查”?

回答

0

没有任何解决方案,这样的文件放在文档里帮助了很多用户,即使它不那么优雅。外部插件(如业务流程)可以做同样的事情,但需要额外的配置。例如,Vagrant盒集成了Icinga Web 2模块。

其他用户倾向于使用check_multi或check_cluster。也不是那么优雅。

虽然这个想法很好,并且持续很长时间,但还没有立即实施这种功能的计划。