12 Configuración de interfaz de equipo inalcanzable/no disponible

Descripción general

Varios parámetros de configuración definen cómo el servidor Zabbix debe comportarse cuando falla la verificación de un agente (Zabbix, SNMP, IPMI, JMX). y una interfaz del equipo se vuelve inalcanzable.

Interfaz inalcanzable

Una interfaz de equipo se trata como inalcanzable después de una comprobación fallida (error de red , tiempo de espera) por agentes Zabbix, SNMP, IPMI o JMX. Tenga en cuenta que las comprobaciones activas del agente Zabbix no influyen en la disponibilidad de la interfaz de ninguna manera.

A partir de ese momento UnreachableDelay define con qué frecuencia una interfaz se vuelve a verificar utilizando una de las métricas (incluyendo las reglas LLD) en esta situación de inaccesibilidad y dichas comprobaciones ya serán realizadas por sondeadores inalcanzables (o sondeadores IPMI para comprobaciones IPMI). Por defecto es de 15 segundos antes del próximo control.

En el registro del servidor Zabbix, la inaccesibilidad se indica mediante mensajes como estos:

La métrica del agente Zabbix "system.cpu.load[percpu,avg1]" en el equipo "Nuevo host" falló: primer error de red, espere 15 segundos
       La métrica del agente Zabbix "system.cpu.load[percpu,avg15]" en el equipo "Nuevo host" falló: otro error de red, espere 15 segundos

Tenga en cuenta que se indica la métrica exacta que falló y el tipo de métrica (Agente Zabbix).

El parámetro Timeout también afectará la antelación con la que la interfaz se vuelve a comprobar durante la inaccesibilidad. Si el tiempo de espera es 20 segundos y UnreachableDelay 30 segundos, la próxima verificación será en 50 segundos después del primer intento.

El parámetro UnreachablePeriod define cuánto tiempo durará en total el periodo de inalcanzabilidad. Por defecto, UnreachablePeriod es de 45 segundos, UnreachablePeriod debería ser varias veces mayor que UnreachableDelay, para que una interfaz se vuelva a verificar más de una vez antes de que una interfaz deje de estar disponible.

Cambiando la interfaz nuevamente a disponible

Cuando finaliza el período de inaccesibilidad, se vuelve a sondear la interfaz, decrementando la prioridad para la métrica que convirtió la interfaz en estado inalcanzable. Si la interfaz inalcanzable reaparece, el monitoreo vuelve al estado normal automáticamente:

reanudando las comprobaciones del agente Zabbix en el equipo "Nuevo host": conexión restaurada

Una vez que la interfaz está disponible, el equipo no sondea todos sus métricas inmediatamente por dos razones:

  • Podría sobrecargar el equipo.
  • El tiempo de restauración de la interfaz no siempre coincide con el horario planificado de la métrica.

Entonces, una vez que la interfaz esté disponible, las métricas no se sondean. inmediatamente, pero están siendo reprogramados para su próxima ronda de consultas.

Interfaz no disponible

Una vez que finaliza el UnreachablePeriod y la interfaz no ha reaparecido, la interfaz se considera no disponible.

En el registro del servidor se indica con mensajes como estos:

deshabilitando temporalmente las comprobaciones del agente Zabbix en el equipo "Nuevo host": interfaz no disponible

y en el frontend el icono de disponibilidad del equipo pasa de verde/gris a amarillo/rojo (los detalles de la interfaz inaccesibles se pueden ver en el cuadro de sugerencias que aparece cuando se coloca el mouse sobre el icono de disponibilidad del equipo):

El parámetro UnavailableDelay define la frecuencia con la que se comprueba una interfaz durante la indisponibilidad de la interfaz.

Por defecto son 60 segundos (por lo que en este caso "deshabilitando temporalmente", del mensaje de registro anterior, significará deshabilitar las comprobaciones durante un minuto).

Cuando se restablece la conexión a la interfaz, el monitoreo regresa a la normalidad automáticamente también:

habilitando las comprobaciones del agente Zabbix en el equipo "Nuevo host": la interfaz vuelve a estar disponible