View Full Version : Problema com a Action
Arckanjo
06-01-2010, 16:42
Senhores,
Tenho essa Action criada:
Teste | Trigger severity = "High" | Send message to Group "Zabbix | administrators" | Enabled
Este servidor Configurado:
VM_WIN2003_01 | Applications (7) | Items (5) | Triggers (2) | Graphs (0) | - | 172.30.7.30 | 10050 | 0000_Ping Monitored
O Zabbix mostra que o servidor esta com problema no Dashboard, mas não me mostra nenhuma action sendo ativada. Ele não me manda nenhum email. Já refiz as configurações da Action e mesmo assim nada.
Alguém poderia me da uma ajuda de como configurar ou testes que posso fazer para eliminar qualquer tipo de problema?
Arckanjo
06-01-2010, 18:16
Senhores, aqui vai mais algumas informações que peguei no log.
24866:20100106:141230.693 Query [txnlev:1] [select t.triggerid, t.value from trigger_depends d,triggers t where d.triggerid_down=13964 and d.triggerid_up=t.triggerid]
24866:20100106:141230.693 End of trigger_dependent_rec():FAIL
24866:20100106:141230.693 End of trigger_dependent():FAIL
24866:20100106:141230.693 In get_latest_event_status(triggerid:13964
24866:20100106:141230.693 Query [txnlev:1] [select eventid,value,clock,object,objectid from events where source=0 and object=0 and objectid=13964 order by object desc,objectid desc,eventid desc limit 2]
24866:20100106:141230.694 tr value [2] event_prev_value [1] event_last_status [2] new_value [1]
24866:20100106:141230.694 Updating trigger
24866:20100106:141230.694 Query [txnlev:1] [update triggers set value=1,lastchange=1262794350,error='' where triggerid=13964]
24866:20100106:141230.694 In process_event(eventid:0,object:0,objectid:13964)
24866:20100106:141230.694 Query [txnlev:1] [select description,priority,comments,url,type from triggers where triggerid=13964]
24866:20100106:141230.694 In get_latest_event_status(triggerid:13964
24866:20100106:141230.694 Query [txnlev:1] [select eventid,value,clock,object,objectid from events where source=0 and object=0 and objectid=13964 order by object desc,objectid desc,eventid desc limit 2]
24866:20100106:141230.694 event_prev_status 1 event_last_status 2 event->value 1
24866:20100106:141230.694 Skip actions
Alguém tem alguma idéia do que esta acontecendo???
Oi,
Perguntas:
O 'usuario' que deveria receber a noticiacao tem permissao de leitura para os hosts envolvidos ?
As 'criticidades' das triggers envolvidas estao configuradas na ACAO e na MEDIA do usuario que deveria receber os alertas ?
Sao erros comuns:
- o usuario NAO ter permissao de leitura para o host envolvido;
- na MEDIA do usuario ter uma configuracao de criticidade diferente da trigger ativada;
E ... sim, o ZABBIX NAO valida essas configuracaoes e NAO mostra isso nos logs. :)
[]s,
Luciano
Arckanjo
06-01-2010, 19:18
Luciano,
Eu estou como administrador, meu user esta com acesso total e ja tinha verificado essas informações que vc me passou.
Muito obrigado pela força mais uma vez.:)
Isso me parece algo relacionado com permissoes de leitura e/ou inconsistencia com a criticidade configurada no usuario e na acao.
Pelas informacoes que tuh passou o ZABBIX nao te mostra a acao sendo executada e isso ocorre em situacoes em que o ZABBIX identifica que NAO deve enviar notificacoes.
Eh interessante habilitar o debug do teu log e verificar se ocorre o disparo (creio que nao) da acao.
Outro detalhe para verificar eh se o 'delay' para o disparo da 'operacao' estah dentro do tempo desejado. Exemplo: se na acao estiver marcado o 'usar escalonamento' e o tempo for o padrao (3600 segundos) e a operacao estiver marcada para disparar no passo 2 ... iso vai demorar 1 hora para disparar.
[]s,
Luciano
Arckanjo
06-01-2010, 19:35
Senhores,
Ate hj pela manha o zabbix estava normal com suas monitorias.
Quando começamos a efetuar testes com as actions foi que identificamos que ele havia parado de enviar emails.
Habilitei e desabilitei o host diversas vezes para ver se assim que identificasse o alarme ele ia gera a trigger novamente enviando o mail para os interessados e mesmo assim ele não gerou a Action. Mostrava que havia o problema, mas não notificava ninguém.
Refiz as configurações da Action e criei outra Action para tirar um possível erro de configuração. Mesmo assim não obtive êxito.
Por fim tive a idéia de desassociar o Template do Host para que não fosse monitorado nada e em seguida salvei. Chequei para ver se ele iria mostrar algum alarme e corretamente não havia nada. Em seguida associei novamente ao Host o Template para que o mesmo fosse monitorado. Ele fez a monitoração e assim que identificou o erro me gerou a Action corretamente enviando-me o email conforme solicitado.
Refiz esse procedimento mais algumas vezes para verificar se esse era realmente o problema e constatei que sim.
Não sei se a idéia da ação esta correta pois para mim ele deveria gerar uma Action todas as vezes que fossem identificados problemas.
Quando desabilitei o host e habilitei novamente, ele deveria ter identificado o problema em seguida gerado a Action para que a pessoa fosse informada, o que somente ocorreu quando retirei o template e coloquei novamente.
Acrescentando. Nesse meio tempo em que ele ficou sem mandar o mail, nós fizemos um reboot na maquina para atestar que não havia causado qlqr outro tipo de problema.
Alguem tem alguma idéia ai do que pode ser ou fazer???
Oi,
Quais as 'condicoes' dessa acao ?
Nela tem referencia a hosts e/ou templates especificos ?
[]s,
Luciano
Arckanjo
06-01-2010, 20:28
A unica condição que tem nela é:
Trigger severity >= "High"
não faz referencia a mais nada.
Arckanjo
06-01-2010, 20:30
Host VM_WIN2003_01
Trigger Network is down
Severity High
Expression {VM_WIN2003_01:icmpping.last(0)}=0
Event generation Normal
Disabled No
Interessante .... :)
O ZABBIX usa a tabela 'actions' para armazenar as informacoes sobre as acoes existentes.
No teu teste (coloca/remove/etc) verifica se nessa tabela existem as acoes que deveriam existir.
Qual a versao do teu zabbix (zabbix_server --version) ?
A instalacao da 1.8 foi fresh ou migracao de versoes anteriores. ?
[]s,
Luciano
Arckanjo
06-01-2010, 21:32
Acredito eu que estao todas as ações la, mesmo pq eu so que que me alerte quando estiver com problema "Severity High". Posso estar enganado, mas acredito q nao.
O Server é 1.8
Os agents 1.8
Instalação do 0, fresh.
[]'s
Nao consegui simular isso aqui :(
Nos teus testes foi possivel 'forcar' a ocorrencia do erro ?
O erro ainda existe par alguma acao especifica ?
Eh possivel enviar o dump da tua base para que possamos colocar em nosso ambiente de testes e verificar isso ?
[]s,
Luciano