我有一个HPC集群,我想用Icinga2来监控它的健康状况。我为集群中的每个节点定义了一些检查,但是如果超过一定百分比的节点生病,我真的很想得到一个通知。Icinga2检查多个主机
我注意到可以定义一个虚拟主机,它代表集群并使用Icinga域特定语言来实现我感兴趣的事情(http://docs.icinga.org/icinga2/latest/doc/module/icinga2/chapter/advanced-topics?highlight-search=up_count#access-object-attributes-at-runtime)。然而,这看起来像是一个不合时宜的尴尬解决方案。
是否可以在主机组上定义这种“聚合”或“元检查”?