PDA

View Full Version : Problema com a Action


Arckanjo
06-01-2010, 16:42
Senhores,

Tenho essa Action criada:

Teste | Trigger severity = "High" | Send message to Group "Zabbix | administrators" | Enabled

Este servidor Configurado:

VM_WIN2003_01 | Applications (7) | Items (5) | Triggers (2) | Graphs (0) | - | 172.30.7.30 | 10050 | 0000_Ping Monitored


O Zabbix mostra que o servidor esta com problema no Dashboard, mas não me mostra nenhuma action sendo ativada. Ele não me manda nenhum email. Já refiz as configurações da Action e mesmo assim nada.

Alguém poderia me da uma ajuda de como configurar ou testes que posso fazer para eliminar qualquer tipo de problema?

Arckanjo
06-01-2010, 18:16
Senhores, aqui vai mais algumas informações que peguei no log.

24866:20100106:141230.693 Query [txnlev:1] [select t.triggerid, t.value from trigger_depends d,triggers t where d.triggerid_down=13964 and d.triggerid_up=t.triggerid]
24866:20100106:141230.693 End of trigger_dependent_rec():FAIL
24866:20100106:141230.693 End of trigger_dependent():FAIL
24866:20100106:141230.693 In get_latest_event_status(triggerid:13964
24866:20100106:141230.693 Query [txnlev:1] [select eventid,value,clock,object,objectid from events where source=0 and object=0 and objectid=13964 order by object desc,objectid desc,eventid desc limit 2]
24866:20100106:141230.694 tr value [2] event_prev_value [1] event_last_status [2] new_value [1]
24866:20100106:141230.694 Updating trigger
24866:20100106:141230.694 Query [txnlev:1] [update triggers set value=1,lastchange=1262794350,error='' where triggerid=13964]
24866:20100106:141230.694 In process_event(eventid:0,object:0,objectid:13964)
24866:20100106:141230.694 Query [txnlev:1] [select description,priority,comments,url,type from triggers where triggerid=13964]
24866:20100106:141230.694 In get_latest_event_status(triggerid:13964
24866:20100106:141230.694 Query [txnlev:1] [select eventid,value,clock,object,objectid from events where source=0 and object=0 and objectid=13964 order by object desc,objectid desc,eventid desc limit 2]
24866:20100106:141230.694 event_prev_status 1 event_last_status 2 event->value 1
24866:20100106:141230.694 Skip actions

Alguém tem alguma idéia do que esta acontecendo???

exkg
06-01-2010, 18:49
Oi,

Perguntas:

O 'usuario' que deveria receber a noticiacao tem permissao de leitura para os hosts envolvidos ?

As 'criticidades' das triggers envolvidas estao configuradas na ACAO e na MEDIA do usuario que deveria receber os alertas ?


Sao erros comuns:

- o usuario NAO ter permissao de leitura para o host envolvido;
- na MEDIA do usuario ter uma configuracao de criticidade diferente da trigger ativada;


E ... sim, o ZABBIX NAO valida essas configuracaoes e NAO mostra isso nos logs. :)


[]s,
Luciano

Arckanjo
06-01-2010, 19:18
Luciano,
Eu estou como administrador, meu user esta com acesso total e ja tinha verificado essas informações que vc me passou.
Muito obrigado pela força mais uma vez.:)

exkg
06-01-2010, 19:30
Isso me parece algo relacionado com permissoes de leitura e/ou inconsistencia com a criticidade configurada no usuario e na acao.

Pelas informacoes que tuh passou o ZABBIX nao te mostra a acao sendo executada e isso ocorre em situacoes em que o ZABBIX identifica que NAO deve enviar notificacoes.

Eh interessante habilitar o debug do teu log e verificar se ocorre o disparo (creio que nao) da acao.

Outro detalhe para verificar eh se o 'delay' para o disparo da 'operacao' estah dentro do tempo desejado. Exemplo: se na acao estiver marcado o 'usar escalonamento' e o tempo for o padrao (3600 segundos) e a operacao estiver marcada para disparar no passo 2 ... iso vai demorar 1 hora para disparar.



[]s,
Luciano

Arckanjo
06-01-2010, 19:35
Senhores,

Ate hj pela manha o zabbix estava normal com suas monitorias.
Quando começamos a efetuar testes com as actions foi que identificamos que ele havia parado de enviar emails.
Habilitei e desabilitei o host diversas vezes para ver se assim que identificasse o alarme ele ia gera a trigger novamente enviando o mail para os interessados e mesmo assim ele não gerou a Action. Mostrava que havia o problema, mas não notificava ninguém.
Refiz as configurações da Action e criei outra Action para tirar um possível erro de configuração. Mesmo assim não obtive êxito.
Por fim tive a idéia de desassociar o Template do Host para que não fosse monitorado nada e em seguida salvei. Chequei para ver se ele iria mostrar algum alarme e corretamente não havia nada. Em seguida associei novamente ao Host o Template para que o mesmo fosse monitorado. Ele fez a monitoração e assim que identificou o erro me gerou a Action corretamente enviando-me o email conforme solicitado.
Refiz esse procedimento mais algumas vezes para verificar se esse era realmente o problema e constatei que sim.
Não sei se a idéia da ação esta correta pois para mim ele deveria gerar uma Action todas as vezes que fossem identificados problemas.
Quando desabilitei o host e habilitei novamente, ele deveria ter identificado o problema em seguida gerado a Action para que a pessoa fosse informada, o que somente ocorreu quando retirei o template e coloquei novamente.
Acrescentando. Nesse meio tempo em que ele ficou sem mandar o mail, nós fizemos um reboot na maquina para atestar que não havia causado qlqr outro tipo de problema.

Alguem tem alguma idéia ai do que pode ser ou fazer???

exkg
06-01-2010, 19:43
Oi,


Quais as 'condicoes' dessa acao ?
Nela tem referencia a hosts e/ou templates especificos ?


[]s,
Luciano

Arckanjo
06-01-2010, 20:28
A unica condição que tem nela é:

Trigger severity >= "High"

não faz referencia a mais nada.

Arckanjo
06-01-2010, 20:30
Host VM_WIN2003_01
Trigger Network is down
Severity High
Expression {VM_WIN2003_01:icmpping.last(0)}=0
Event generation Normal
Disabled No

exkg
06-01-2010, 20:41
Interessante .... :)

O ZABBIX usa a tabela 'actions' para armazenar as informacoes sobre as acoes existentes.

No teu teste (coloca/remove/etc) verifica se nessa tabela existem as acoes que deveriam existir.

Qual a versao do teu zabbix (zabbix_server --version) ?
A instalacao da 1.8 foi fresh ou migracao de versoes anteriores. ?


[]s,
Luciano

Arckanjo
06-01-2010, 21:32
Acredito eu que estao todas as ações la, mesmo pq eu so que que me alerte quando estiver com problema "Severity High". Posso estar enganado, mas acredito q nao.

O Server é 1.8
Os agents 1.8
Instalação do 0, fresh.

[]'s

exkg
07-01-2010, 17:56
Nao consegui simular isso aqui :(

Nos teus testes foi possivel 'forcar' a ocorrencia do erro ?

O erro ainda existe par alguma acao especifica ?

Eh possivel enviar o dump da tua base para que possamos colocar em nosso ambiente de testes e verificar isso ?


[]s,
Luciano