Ad Widget

**Hernandes Martins** · 16-11-2018, 13:31

Olá meu caro,

Muito bem detalhado seu questionamento, sugiro apenas ajustar a sua trigger com a função Média(Average) = avg.

Deixe-a mais simples e objetiva com apenas uma expressão, nesse primeiro momento.

{Template Conectividade:icmpping[,{$PING},,,].avg(5m)}=0

Depois se necessário adicione dependência de trigger, acredito que os seus CPEs dependem de um concentrador, então coloque a trigger do concentrador nos hosts que estão atrás deste concentrador.

Outra sugestão é analisar os operadores que pode utilizar nas expressões: https://www.zabbix.com/documentation...iggers/trigger

Abraços

**JCast638** · 16-11-2018, 16:33

Perfeito Hernandes,

Estou nesse momento realizando o ajuste sugerido na trigger, irei observar durante o decorrer do dia, e reporto noticias.

Paz.

**JCast638** · 18-11-2018, 22:59

Prezados,

Continuando...

Acabo de ter um incidente - incidente ocorreu durante um intervalo de duas horas - massivo relacionado a infraestrutura elétrica que alimenta o switche onde o Zabbix Server está aprovisionado (conectado), durante o incidente o switche ligou e desligou por diversas vezes afetando a coleta de dados de todos os hosts da infraestrutura.

Gathering Process durante a ocorrência da falha:

Sinceramente ainda tive ocorrências da falha descrita no primeiro post, no entanto, o número de hosts que não foram atualizados na tela Monitoramento -> Triggers foi consideravelmente menor:

Como podemos observar o host 10.20.1.129, e todos os demais no print, além de estarem "pingando" não saem da tela Monitoramento -> Ping.
Em sequência executei o restart do serviço do Zabbix (/etc/init.d/zabbix_server restart) e os hosts afetados pela falha sumiram da tela Moniramento -> Triggers. OK.

Este novo fato fez-em voltar a atenção para o gráfico acima "Zabbix data gathering proccess busy" , principalmente para os dados que durante o incidente saturam os recursos de processamento, que podem estar afetando na coleta de dados e consequentemente os alarmes, são os dados de: Zabbix busy unreachable poller processes e Zabbix busy poller processes. Atualmente minha configuração está como segue (arquivo zabbix_server.conf):

StartPollers = 30
StartPollersUnreachable = 60

Acredito serem estas duas variáveis nas quais tenho que trabalhar daqui pra frente, referente ao triggers sugerido pelo colega @Hernandes o mesmo está funcionando conforme o esperado - fica a dica de sempre tentar simplificar ao máximo as expressões dos triggers; considero também que um incidente como este que ocorreu hoje, afetando a coleta de todos os hosts monitorados, não é muito comum de acontecer, e é de se esperar um aumento no processamento referente a coleta de dados. Beleza galera estou aberto a sugestões.

Abraços,
Jefferson

Ad Widget

Problemas com Trigger de ICMP PING

Problemas com Trigger de ICMP PING

Comment

Comment

Comment