Vários parâmetros de configuração definem como o Zabbix server deve se comportar quando uma verificação de agent (Zabbix, SNMP, IPMI, JMX) falha e uma interface de host se torna inacessível.
Uma interface de host é tratada como inalcançável após uma verificação com falha (erro de rede, timeout) pelos agentes Zabbix, SNMP, IPMI ou JMX. Desde o Zabbix 6.2.0, as verificações ativas do agent Zabbix também afetam a disponibilidade da interface. Quando as verificações ativas se tornam indisponíveis, elas contribuem para o status geral de disponibilidade da interface do agent.
A partir do momento em que uma interface se torna inalcançável, o parâmetro UnreachableDelay define com que frequência ela será rechecada usando um dos items (incluindo regras LLD). Essas rechecagens são realizadas por pollers de interfaces inalcançáveis (ou pollers IPMI para verificações IPMI). Por padrão, o intervalo entre verificações consecutivas de disponibilidade é de 15 segundos.
As verificações realizadas por pollers assíncronos não são movidas para pollers de interfaces inalcançáveis.
No log do server Zabbix, a indisponibilidade é indicada por mensagens como:
Zabbix agent item "system.cpu.load[percpu,avg1]" on host "New host" failed: first network error, wait for 15 seconds
Zabbix agent item "system.cpu.load[percpu,avg15]" on host "New host" failed: another network error, wait for 15 secondsAs mensagens de log especificam o item exato que falhou e seu tipo (agent Zabbix).
O parâmetro Timeout também afetará o quão cedo uma interface será rechecada durante a indisponibilidade. Se o Timeout estiver definido para 20 segundos e o UnreachableDelay para 30 segundos, a próxima verificação será em 50 segundos após a primeira tentativa.
O parâmetro UnreachablePeriod define a duração total do período de indisponibilidade. Por padrão, o UnreachablePeriod é de 45 segundos. Esse valor deve ser várias vezes maior que o UnreachableDelay para garantir que uma interface seja rechecada várias vezes antes de ser marcada como indisponível.
Um item interno, zabbix[host,active_agent,available], permite monitorar a disponibilidade de verificações ativas em cenários de indisponibilidade.
Quando o período de inacessibilidade termina, a interface é verificada novamente, diminuindo a prioridade para o item que tornou a interface inacessível. Se a interface inacessível reaparecer, o monitoramento retorna ao normal automaticamente:
Assim que a interface se torna disponível, o host não verifica todos os seus items imediatamente por dois motivos:
Portanto, após a interface se tornar disponível, os items não são verificados imediatamente, mas são reagendados para a próxima rodada de verificação.
Após o término do UnreachablePeriod e a interface não ter reaparecido, a interface é tratada como indisponível.
No log do server isso é indicado por mensagens como estas:
e no frontend o ícone de disponibilidade do host vai de verde/cinza para amarelo/vermelho (os detalhes da interface indisponível podem ser vistos na caixa de dica que é exibida quando o mouse é posicionado sobre o ícone de disponibilidade do host):

O parâmetro UnavailableDelay define com que frequência uma interface é verificada durante a indisponibilidade da interface.
Por padrão, é de 60 segundos (então, neste caso, "temporarily disabling", da mensagem de log acima, significará desabilitar as verificações por um minuto).
Quando a conexão com a interface é restaurada, o monitoramento retorna ao normal automaticamente também: