2013-02-25 50 views
1

我已经构建的Nagios的远程主机监控设置(非NRPE),以及它的功能和用处,只是:控制Nagios的登录频率当监控远程主机

不知怎的,我发现,Nagios的主机日志中到不同的远程主机,每隔3分钟左右退出一秒钟(如果不在同一秒内);这多少次这似乎并不是确定性的。这些登录与我定义的任何检查周期不一致。

从我的远程主机阵列的auth.log的任意成员:

Feb 25 10:51:11 MACHINE sshd[3590]: Accepted publickey for nagios from 10.1.2.110 port 54069 ssh2 
Feb 25 10:51:11 MACHINE sshd[3590]: pam_unix(sshd:session): session opened for user nagios by (uid=0) 
Feb 25 10:51:11 MACHINE sshd[3599]: Received disconnect from 10.1.2.110: 11: disconnected by user 
Feb 25 10:51:11 MACHINE sshd[3590]: pam_unix(sshd:session): session closed for user nagios 

然后,三分钟后:

Feb 25 10:54:10 MACHINE sshd[3632]: Accepted publickey for nagios from 10.1.2.110 port 54176 ssh2 
Feb 25 10:54:10 MACHINE sshd[3632]: pam_unix(sshd:session): session opened for user nagios by (uid=0) 
Feb 25 10:54:10 MACHINE sshd[3642]: Received disconnect from 10.1.2.110: 11: disconnected by user 
Feb 25 10:54:10 MACHINE sshd[3632]: pam_unix(sshd:session): session closed for user nagios 

我想不出它。我的服务遵循通用服务模板,我已经修改了稍长的检查间隔和最大检查尝试次数。为什么Nagios在这个系列登录疯狂?

回答

0

你是否检查了你的主机定义?你用什么做'check-host'?如果执行了“通过”NRPE检查(而不是像“本地”检查),那么它也可以登录。

你也可以检查你的Nagios日志文件,看看实际执行什么检查。我通常执行'tail -f nagios.log | grep [IP_ADDRESS_of_target_host]'将结果缩小到特定的机器。

如果没有显示出来,在最后的努力中,您可以启用调试并检查Nagios调试文件 - 一切Nagios都会进入该文件。由于调试文件会非常快地滚动(至少在我们的安装 - > 6.8K检查中),您可能需要通过'grep'来找到您想要的内容。

0

如果检查返回CRITICAL/WARNING状态,则可能是因为您的retry_interval设置为3分钟,我相信这是默认设置。双击您的服务模板nagios/etc/objects/templates