12 不可达/不可用主机接口设置

多个配置 parameters定义了当agent检查(Zabbix、SNMP、IPMI、JMX)失败且主机接口变为不可达时Zabbix服务器的行为方式。

不可达接口

当Zabbix、SNMP、IPMI或JMX agents检查失败(网络错误、超时)后,主机接口将被视为不可达。请注意Zabbix agent主动检查不会以任何方式影响接口可用性。

从此刻起,UnreachableDelay参数定义了在此不可达状态下使用监控项(包括LLD规则)重新检查接口的频率,这类重新检查将由不可达轮询器(或IPMI检查对应的IPMI轮询器)执行。默认情况下,下次检查将在15秒后进行。

在Zabbix server日志中,不可达状态会显示如下消息:

Zabbix agent 监控项 "system.cpu.load[percpu,avg1]" 在主机 "新建主机"失败:首次网络错误,等待15秒
       Zabbix agent 监控项 "system.cpu.load[percpu,avg15]" 在主机 "新建主机"失败:再次网络错误,等待15秒

请注意日志会明确显示失败的监控项及其类型(Zabbix agent)。

Timeout参数同样会影响接口在不可达状态下的重新检查时机。如果Timeout为20秒且UnreachableDelay为30秒,则下次检查将在首次尝试后的50秒进行。

UnreachablePeriod参数定义了不可达状态的总持续时间。默认UnreachablePeriod为45秒。UnreachablePeriod应数倍于UnreachableDelay,以确保接口在变为不可用前能经过多次重新检查。

将接口切换回可用状态

当不可达状态周期结束后,系统会重新轮询该接口,并降低导致接口进入不可达状态的监控项优先级。如果不可达接口重新出现,监控将自动恢复正常:

恢复在主机"新主机"上的Zabbix agent检查:连接已恢复

接口恢复可用后,主机不会立即轮询其所有监控项,原因有二:

  • 可能导致主机过载
  • 接口恢复时间并不总是与计划的监控项轮询时间匹配

因此,接口恢复可用后,监控项不会被立即轮询,而是被重新调度至下一轮轮询周期。

不可用接口

当不可达周期结束后且接口仍未重新出现时,该接口将被视为不可用。

在服务器日志中会显示如下消息:

临时禁用主机"New 主机"上的Zabbix agent检查:接口不可用

同时在 frontend 中,主机可用性图标会从绿色/灰色变为黄色/红色(当鼠标悬停在主机可用性图标上时,提示框中会显示不可达接口的详细信息):

UnavailableDelay参数定义了在接口不可用期间检查接口的频率。

默认情况下为60秒(因此上述日志消息中的"临时禁用"意味着禁用检查一分钟)。

当与接口的连接恢复时,监控也会自动恢复正常:

启用主机"New 主机"上的Zabbix agent检查:接口已恢复可用