Esta página fue traducida automáticamente. Si detectas un error, selecciónalo y presiona Ctrl+Enter para informarlo a los editores.

11 Configuración de interfaz de equipo inalcanzable/no disponible

Descripción general

Varios parámetros de configuración definen cómo el servidor Zabbix debe comportarse cuando falla la verificación de un agente (Zabbix, SNMP, IPMI, JMX). y una interfaz del equipo se vuelve inalcanzable.

Interfaz inalcanzable

Una interfaz de host se considera inalcanzable después de una comprobación fallida (error de red, tiempo de espera) por parte de los agentes Zabbix, SNMP, IPMI o JMX. Desde Zabbix 6.2.0, las comprobaciones activas del agente Zabbix también afectan a la disponibilidad de la interfaz. Cuando las comprobaciones activas se vuelven no disponibles, contribuyen al estado general de disponibilidad de la interfaz del agente.

Desde el momento en que una interfaz se vuelve inalcanzable, UnreachableDelay define con qué frecuencia se vuelve a comprobar utilizando uno de los ítems (incluyendo reglas LLD). Estas comprobaciones se realizan mediante sondeadores de inalcanzables (o sondeadores IPMI para comprobaciones IPMI). Por defecto, el intervalo entre comprobaciones consecutivas de accesibilidad es de 15 segundos.

Las comprobaciones realizadas por sondeadores asíncronos no se trasladan a los sondeadores de inalcanzables.

En el registro del servidor Zabbix, la inaccesibilidad se indica mediante mensajes como:

El ítem del agente Zabbix "system.cpu.load[percpu,avg1]" en el host "Nuevo host" falló: primer error de red, esperar 15 segundos
       El ítem del agente Zabbix "system.cpu.load[percpu,avg15]" en el host "Nuevo host" falló: otro error de red, esperar 15 segundos

Los mensajes del registro especifican el ítem exacto que falló y su tipo (agente Zabbix).

El parámetro Timeout también afectará a la rapidez con la que se vuelve a comprobar una interfaz durante la inaccesibilidad. Si Timeout se establece en 20 segundos y UnreachableDelay en 30 segundos, la siguiente comprobación será a los 50 segundos después del primer intento.

El parámetro UnreachablePeriod define la duración total del período de inaccesibilidad. Por defecto, UnreachablePeriod es de 45 segundos. Este valor debe ser varias veces mayor que UnreachableDelay para asegurar que una interfaz se vuelva a comprobar varias veces antes de marcarse como no disponible.

Un ítem interno, zabbix[host,active_agent,available], permite monitorizar la disponibilidad de las comprobaciones activas en escenarios de inaccesibilidad.

Cambiando la interfaz nuevamente a disponible

Cuando finaliza el período de inaccesibilidad, se vuelve a sondear la interfaz, decrementando la prioridad para la métrica que convirtió la interfaz en estado inalcanzable. Si la interfaz inalcanzable reaparece, el monitoreo vuelve al estado normal automáticamente:

reanudando las comprobaciones del agente Zabbix en el equipo "Nuevo host": conexión restaurada

Una vez que la interfaz está disponible, el equipo no sondea todos sus métricas inmediatamente por dos razones:

  • Podría sobrecargar el equipo.
  • El tiempo de restauración de la interfaz no siempre coincide con el horario planificado de la métrica.

Entonces, una vez que la interfaz esté disponible, las métricas no se sondean. inmediatamente, pero están siendo reprogramados para su próxima ronda de consultas.

Interfaz no disponible

Después de que finaliza el UnreachablePeriod y la interfaz no ha reaparecido, la interfaz se trata como no disponible.

En el registro del servidor se indica mediante mensajes como estos:

deshabilitando temporalmente las comprobaciones del agente Zabbix en el equipo "Nuevo equipo": interfaz no disponible

y en el frontend el icono de disponibilidad del equipo pasa de verde/gris a amarillo/rojo (los detalles de la interfaz no disponible pueden verse en el cuadro de sugerencia que se muestra cuando se posiciona el ratón sobre el icono de disponibilidad del equipo):

El parámetro UnavailableDelay define con qué frecuencia se verifica una interfaz durante la indisponibilidad de la interfaz.

Por defecto es de 60 segundos (por lo que en este caso "deshabilitando temporalmente", del mensaje de registro anterior, significará deshabilitar las comprobaciones durante un minuto).

Cuando se restablece la conexión con la interfaz, la monitorización vuelve a la normalidad automáticamente también:

habilitando las comprobaciones del agente Zabbix en el equipo "Nuevo equipo": la interfaz volvió a estar disponible