Esta é uma tradução da página de documentação original em inglês. Ajude-nos a torná-la melhor.

12 Definições de host inalcançável/inacessível

Visão geral

Diversos parâmetros de configuração definem como o Zabbix Server irá agir quando uma verificação de agente (Zabbix, SNMP, IPMI, JMX) falhar e um host passar a se tornar inacessível.

Interface inacessível

Uma interface de host é tratada como inacessível após uma falha na verificação (rede error, timeout) pelos agentes Zabbix, SNMP, IPMI ou JMX. Observe que o Zabbix as verificações ativas do agente não influenciam a disponibilidade da interface de forma alguma.

A partir desse momento, UnreachableDelay define com que frequência uma interface é verificado novamente usando um dos itens (incluindo regras LLD) neste situação de inacessibilidade e tais verificações já serão realizadas por pollers inacessíveis (ou pollers IPMI para verificações de IPMI). Por padrão é 15 segundos antes da próxima verificação.

No log do servidor Zabbix, a inacessibilidade é indicada por mensagens como esses:

O item do agente Zabbix "system.cpu.load[percpu,avg1]" no host "Novo host" falhou: primeiro erro de rede, aguarde 15 segundos
       Item do agente Zabbix "system.cpu.load[percpu,avg15]" no host "Novo host" falhou: outro erro de rede, aguarde 15 segundos

Observe que o item exato que falhou é indicado e o tipo de item (agente Zabbix).

O parâmetro Timeout também afetará o quão cedo um interface é verificada novamente durante a inacessibilidade. Se o tempo limite for 20 segundos e UnreachableDelay 30 segundos, a próxima verificação será em 50 segundos segundos após a primeira tentativa.

O parâmetro UnreachablePeriod define por quanto tempo a inacessibilidade período é total. Por padrão, UnreachablePeriod é de 45 segundos. UnreachablePeriod deve ser várias vezes maior que UnreachableDelay, para que uma interface seja verificada mais de uma vez antes de uma interface fica indisponível.

Alternando a interface de volta para disponível

Quando o período de inacessibilidade termina, a interface é sondada novamente, diminuindo a prioridade para o item que tornou a interface inacessível Estado. Se a interface inacessível reaparecer, o monitoramento retorna ao normal automaticamente:

retomando as verificações do agente Zabbix no host "Novo host": conexão restaurada

Uma vez que a interface se torna disponível, o host não pesquisa todos seus itens imediatamente por dois motivos:

  • Pode sobrecarregar o host.
  • O tempo de restauração da interface nem sempre corresponde ao item planejado horário da agenda de votação.

Assim, após a disponibilização da interface, os itens não são pesquisados imediatamente, mas eles estão sendo remarcados para a próxima votação volta.

Interface indisponível

Após o término do UnreachablePeriod e a interface não reaparecer, a interface é tratada como indisponível.

No log do servidor é indicado por mensagens como estas:

desabilitando temporariamente as verificações do agente Zabbix no host "Novo host": interface indisponível

E no frontend o ícone de disponibilidade do host vai de verde/cinza para amarelo/vermelho (o detalhes de interface inacessíveis podem ser vistos na caixa de dicas que é exibido quando um mouse é posicionado no ícone de disponibilidade do host):

O parâmetro UnavailableDelay define com que frequência uma interface é verificado durante a indisponibilidade da interface.

Por padrão, são 60 segundos (então, neste caso, "desativando temporariamente", da mensagem de log acima, significará desabilitar as verificações por um minuto).

Quando a conexão com a interface é restaurada, o monitoramento retorna ao normal automaticamente também:

habilitando as verificações do agente Zabbix no host "Novo host": a interface ficou disponível