Esta página foi traduzida automaticamente. Se você notar um erro, selecione-o e pressione Ctrl+Enter para reportá-lo aos editores.

11 Configurações de interface de host inacessível/indisponível

Visão geral

Diversos parâmetros de configuração definem como o Zabbix Server irá agir quando uma verificação de agente (Zabbix, SNMP, IPMI, JMX) falhar e um host passar a se tornar inacessível.

Interface inalcançável

Uma interface de host é tratada como inalcançável após uma verificação com falha (erro de rede, timeout) pelos agentes Zabbix, SNMP, IPMI ou JMX. Desde o Zabbix 6.2.0, as verificações ativas do agent Zabbix também afetam a disponibilidade da interface. Quando as verificações ativas se tornam indisponíveis, elas contribuem para o status geral de disponibilidade da interface do agent.

A partir do momento em que uma interface se torna inalcançável, o parâmetro UnreachableDelay define com que frequência ela será rechecada usando um dos items (incluindo regras LLD). Essas rechecagens são realizadas por pollers de interfaces inalcançáveis (ou pollers IPMI para verificações IPMI). Por padrão, o intervalo entre verificações consecutivas de disponibilidade é de 15 segundos.

As verificações realizadas por pollers assíncronos não são movidas para pollers de interfaces inalcançáveis.

No log do server Zabbix, a indisponibilidade é indicada por mensagens como:

Zabbix agent item "system.cpu.load[percpu,avg1]" on host "New host" failed: first network error, wait for 15 seconds
       Zabbix agent item "system.cpu.load[percpu,avg15]" on host "New host" failed: another network error, wait for 15 seconds

As mensagens de log especificam exatamente o item que falhou e seu tipo (agent Zabbix).

O parâmetro Timeout também afetará o quão cedo uma interface será rechecada durante a indisponibilidade. Se o Timeout estiver definido para 20 segundos e o UnreachableDelay para 30 segundos, a próxima verificação será em 50 segundos após a primeira tentativa.

O parâmetro UnreachablePeriod define a duração total do período de indisponibilidade. Por padrão, o UnreachablePeriod é de 45 segundos. Esse valor deve ser várias vezes maior que o UnreachableDelay para garantir que uma interface seja rechecada várias vezes antes de ser marcada como indisponível.

Um item interno, zabbix[host,active_agent,available], permite monitorar a disponibilidade de verificações ativas em cenários de indisponibilidade.

Alternando a interface de volta para disponível

Quando o período de inacessibilidade termina, a interface é sondada novamente, diminuindo a prioridade para o item que tornou a interface inacessível Estado. Se a interface inacessível reaparecer, o monitoramento retorna ao normal automaticamente:

retomando as verificações do agente Zabbix no host "Novo host": conexão restaurada

Uma vez que a interface se torna disponível, o host não pesquisa todos seus itens imediatamente por dois motivos:

  • Pode sobrecarregar o host.
  • O tempo de restauração da interface nem sempre corresponde ao item planejado horário da agenda de votação.

Assim, após a disponibilização da interface, os itens não são pesquisados imediatamente, mas eles estão sendo remarcados para a próxima votação volta.

Interface indisponível

Após o término do UnreachablePeriod e a interface não ter reaparecido, a interface é tratada como indisponível.

No log do server isso é indicado por mensagens como estas:

temporarily disabling Zabbix agent checks on host "New host": interface unavailable

e no frontend o ícone de disponibilidade do host vai de verde/cinza para amarelo/vermelho (os detalhes da interface indisponível podem ser vistos na caixa de dica que é exibida quando o mouse é posicionado sobre o ícone de disponibilidade do host):

O parâmetro UnavailableDelay define com que frequência uma interface é verificada durante a indisponibilidade da interface.

Por padrão, é de 60 segundos (então, neste caso, "temporarily disabling", da mensagem de log acima, significará desabilitar as verificações por um minuto).

Quando a conexão com a interface é restaurada, o monitoramento retorna ao normal automaticamente também:

enabling Zabbix agent checks on host "New host": interface became available