PDA

View Full Version : Monitoramento Windows - Iniciante


PRRS
11-07-2011, 16:41
Bom dia para todos !!!

Sou iniciante em Zabbix e estou tentando implementar o software na cia para "marcar um gol" junto com a empresa e meus gestores.

Instalei o servidor Zabbix em uma Vmware e 90% das máquinas que pretendo monitorar são VM'S em VMware Esx Entreprise Edition 3.2.1.

Meu primeiro teste é monitorar se um servidor Windows está fora do ar e enviar um e-mail para minha conta. Mais tarde enviarei para toda a equipe de suporte.

Já fiz vários testes mas não consigo receber os e-mails. Quando desconecto a placa de rede do servidor o Servidor Zabbix detecta a falha, mas não recebo o e-mail.

Instalei o agente do Zabbix no Servidor.

Gostaria de colar as imagens das minhas configurações para que entendam melhor o meu cenário.

Como faço para colar as imagens diretamente no Thread ?

Obrigado

Paz, Saúde e Amor !!!

PRRS
11-07-2011, 16:53
Já acertei as imagens.

Seguem minhas configurações.

PRRS
11-07-2011, 23:49
Eu apenas gostaria inicialmente ser informado quando um servidor estivesse fora do ar.

Implementei algumas ações a mais, como configurar "media", usuário para envio de email e associei meu servidor a template "Windows Servers".

As telas seguem em anexo.

Obrigado

PRRS
11-07-2011, 23:50
Seguem o restante das telas de minha configuração.

PRRS
12-07-2011, 20:05
Do servidor zabbix via ssh, efetuei um telnet na porta 24 do meu servidor de correio e consegui passar um e-mail para minha conta.

Não é problema de e-mail.

Verifiquei o LOG do servidor Zabbix :

1998:20110712:144402.552 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1991:20110712:144602.665 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1993:20110712:144802.801 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1984:20110712:144923.830 Item [GMZ3PS01:system.cpu.load[,avg1]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1984:20110712:144923.838 Zabbix Host [GMZ3PS01]: first network error, wait for 15 seconds
1981:20110712:144924.831 Item [GMZ3PS01:system.cpu.load[,avg5]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1981:20110712:144924.848 Zabbix Host [GMZ3PS01]: another network error, wait for 15 seconds
1990:20110712:144942.322 Item [GMZ3PS01:system.swap.size[,free]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:144942.344 Zabbix Host [GMZ3PS01]: another network error, wait for 15 seconds
1990:20110712:145000.347 Item [GMZ3PS01:system.cpu.load[,avg15]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:145000.376 Zabbix Host [GMZ3PS01]: another network error, wait for 15 seconds
1992:20110712:145002.907 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1990:20110712:145018.379 Item [GMZ3PS01:system.cpu.load[,avg5]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:145018.400 Disabling Zabbix host [GMZ3PS01]
1990:20110712:145121.410 Item [GMZ3PS01:vm.memory.size[free]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1994:20110712:145202.982 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1990:20110712:145224.445 Item [GMZ3PS01:agent.ping] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:145327.475 Item [GMZ3PS01:proc.num[]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1994:20110712:145402.063 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1990:20110712:145430.542 Item [GMZ3PS01:perf_counter[\System\File Write Bytes/sec]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:145530.557 Enabling Zabbix host [GMZ3PS01]
1993:20110712:145602.204 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1994:20110712:145802.386 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1991:20110712:150002.533 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored

Italo Fernando Lopes
14-07-2011, 20:47
Do servidor zabbix via ssh, efetuei um telnet na porta 24 do meu servidor de correio e consegui passar um e-mail para minha conta.

Não é problema de e-mail.

Verifiquei o LOG do servidor Zabbix :

1998:20110712:144402.552 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1991:20110712:144602.665 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1993:20110712:144802.801 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1984:20110712:144923.830 Item [GMZ3PS01:system.cpu.load[,avg1]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1984:20110712:144923.838 Zabbix Host [GMZ3PS01]: first network error, wait for 15 seconds
1981:20110712:144924.831 Item [GMZ3PS01:system.cpu.load[,avg5]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1981:20110712:144924.848 Zabbix Host [GMZ3PS01]: another network error, wait for 15 seconds
1990:20110712:144942.322 Item [GMZ3PS01:system.swap.size[,free]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:144942.344 Zabbix Host [GMZ3PS01]: another network error, wait for 15 seconds
1990:20110712:145000.347 Item [GMZ3PS01:system.cpu.load[,avg15]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:145000.376 Zabbix Host [GMZ3PS01]: another network error, wait for 15 seconds
1992:20110712:145002.907 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1990:20110712:145018.379 Item [GMZ3PS01:system.cpu.load[,avg5]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:145018.400 Disabling Zabbix host [GMZ3PS01]
1990:20110712:145121.410 Item [GMZ3PS01:vm.memory.size[free]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1994:20110712:145202.982 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1990:20110712:145224.445 Item [GMZ3PS01:agent.ping] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:145327.475 Item [GMZ3PS01:proc.num[]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1994:20110712:145402.063 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1990:20110712:145430.542 Item [GMZ3PS01:perf_counter[\System\File Write Bytes/sec]] error: Get value from agent failed: Cannot connect to [129.99.70.200:10050] [Interrupted system call]
1990:20110712:145530.557 Enabling Zabbix host [GMZ3PS01]
1993:20110712:145602.204 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1994:20110712:145802.386 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored
1991:20110712:150002.533 Sending list of active checks to [127.0.0.1] failed: host [Zabbix server] not monitored

Boa tarde.

Você não configurou nenhuma condição de ação
clica em nova selecione trigger e procure pela trigger no qual informa a indisponibilidade do equipamento.
Salva e pronto agora esta ok.

tiagosoares
18-07-2011, 18:41
Na "Action conditions" de sua action configure como falado anteriormente ou:

Host = (selecione o host que quer alarmar)

e por último, mas não menos importante:

Trigger value = PROBLEM

Senão sua action nunca vai ser acionada...

[]'s

Tiago.

PRRS
19-07-2011, 14:09
Tiago, obrigado pela ajuda.

Parece que eu não estou acertando na Expressão do Trigger.

Gostaria de testar se um servidor está ou não em operação.

Minha primeira idéia foi através de Ping, mas confesso que não sei se esta é a melhor maneira.

{GMZ3PS01:agent.ping.sum(0)}#1

Tiro o servidor do ar, mas a Trigger não dispara a Action.

Paz, Saúde e Amor.

Paulo

PRRS
19-07-2011, 19:30
Boa tarde para todos !!!

Através de buscas pela Internet achei o parãmetro abaixo para o trigger

{GMZ3PS01:agent.ping.nodata(30)}=1

Este funcionou.

Procurarei aonde acho estes valores para cada parãmetro para não ficar perdido como fiquei.

Obrigado

Paz, Saúde e Amor

Paulo Roberto

tiagosoares
21-07-2011, 19:51
Paulo, boa tarde!

Da uma olhada no link abaixo que tem tudo o que você precisa!

http://www.zabbix.com/documentation/1.8/manual/config/triggers

Qualquer dúvida é só falar!

Tiago.

PRRS
22-07-2011, 16:13
Obrigado Tiago pela ajuda.

Paz, Saúde e Amor.

Paulo

vzanchettin
22-07-2011, 19:10
Você precisa criar o critério da action.

Ex: Configuration - Action - Add

crie uma nova Action conditions, e nela coloque uma lógica como "Trigger value = "PROBLEM"".

E o seu servidor de zabbix tem que ter um relay de email configurado, pois ele não autentica. Qualquer coisa pode me solicitar é bem facil de fazer.