View Full Version : Dados errados?
lndgoncalves
30-06-2010, 20:16
Boa tarde,
pessoal, estou com um pequino problema aqui. bom acho que é um..
o que acontece e o seguinte. 1 grafico meu, de um determinado servidor, não estava gerando corretamente os dados.
era pra medir os dados da cpu. inclusive no item eu pego os dados assim, ex:
system.cpu.util[]
mas o grafico tava perfeito ate hoje.
porem agora atarde ele esta assim,
http://a.yfrog.com/img9/4266/grafico1g.jpg
estive dando uma olhada, ai quando vou em dados recentes notei que ele pegou valores negativos.
como na imagem abaixo.
http://img139.imageshack.us/img139/4918/semttulosti.jpg
em uso dos Processadores: -1.88.
bom, achei estranho por que deveria ser 0 ese valor.
o que pode ser?
alguem tem alguma ideia?
Essa coluna com valores positivos/negativos/zerados representa a variação entre o último e penúltimo valores recebidos. Lembrando que a coluna à esquerda dessa mostra o último valor registrado pelo servidor zabbix.
lndgoncalves
01-07-2010, 14:20
ta mas neste caso deveria pegar valores negativos?
mesmo se pegasse, não deveria gera o grafico corretamente?
Mas afinal de contas, qual é o problema com seu gráfico, lndgoncalves? Não há valores negativos nele! Se não me falha a memória, a chave system.cpu.util[] retorna valores de 0 a 100 e não vejo nada fora disso no seu gráfico. É lógico que se num dado instante você receber o valor 40 para essa chave e num momento posterior você receber 39, a coluna Change (Variação) irá mostrar -1. O negativo nesse caso representa um decrescimento no valor absoluto coletado em relação ao item anterior, mas os itens coletados são sempre positivos ou zero.
O que mudou no seu gráfico para justificar seu espanto? Você mudou alguma coisa na configuração do zabbix?
lndgoncalves
01-07-2010, 18:18
ah ok..
Me desculpe, eu entendi errado esta coluna de variação.
o problema é: por que estava gerando este grafico?
pode pensar.. ele nao estava recebendo os dados. mas, no momento que tirei esse Screen do grafico, as 15:08 foi a mesma que tirei da outra imagem, onde ele recebe o valor de: 26.02.
este valor, 26.02 não deveria estar no grafico?
ele nao deveria ter gerado?
essa e a duvida!.
Mas o valor 26,02 foi sim representado no gráfico, às 14h15. O que não estou entendendo é por que o zabbix deixou de coletar os dados relativos à chave system.cpu.util[], uma vez que das 14h16 às 15h08 não há dados no seu gráfico. Você verificou se o agente zabbix está rodando no seu host remoto? Na tela de configuração->Itens você checou se há algum erro no item com a chave system.cpu.util[]?
.... sei nao ... mas me parece que o ZABBIX server do nosso amigo lndgoncalves tah parado ... o ultimo valor coletado (Dados recentes) eh o dado que estha no grafico .. portanto (aparentemente) nao existem probemas nesse ponto. Porem a imagem do grafico eh de quase 1 hora depois e ... estah vazio ... o Dados recentes tb nao tem mais nada depois do ultimo item coletado ...
Apostaria (vejam bem ... apostaria ... nao apostei ainda) os meus dois dentes da frente que o zabbix server tah parado :)
[]s,
Luciano
lndgoncalves
02-07-2010, 13:51
Ola,
bom. o Zabbix_server não ta parado não.
o que notei ontem, foi o seguinte.
um host meu aqui. comecou a fazer isso as 14h ficou 25min sem gerar graficos somente dele, e depois voltou.
todos os hosts estavam gerando normalmente somente esse que não.
notei que esse host estava muito lento, processamento alto, e consumo de memoria alta tambem.
Porem, o zabbix_agentd não estava mandando informações para o Server.
ah e um host Windows...
quando entrei no host e matei alguns processos que estavam consumindo muita memoria e processador..
voltava ao normal, e o zabbix gerava os graficos corretamente.
;) melhor assim ... eu fiquei com meus dentes da frente e tuh encontrou o problema.
[]s,
Luciano
lndgoncalves
02-07-2010, 18:25
hehehe...
voce ficou sem seus dedos isso sim hehe =)
bom, o problema eu encontrei, agora..
como resolver :(
por que, mais que ele fica lento, deveria acionar uma trigger que tenho falando do processador com mais de 80 em uso. ele não aciona.
porem para de enviar os dados.
o que pode ser?
alguma sugestão?
Já tive problemas semelhantes com meus servidores de Terminal Service. São tantas seções remotas que o consumo de CPU e memória iam lá pra cima. O agente zabbix só passou a funcionar melhor quando melhoramos o hardware dos servidores. É meio raro, mas atualmente ocorre de o agente zabbix não reportar alguns dados nesses servidores quando a carga está alta. Meus gráficos ficam com um ou dois pontos de descontinuidade ao longo do dia, mas nada muito duradouro ou que prejudique suas análises.
Percebi que nesses momentos de elevada carga, o agente zabbix não responde no tempo ou na forma adequada e a seguinte informação é exibida no log do zabbix server:
Item [meuServidor:ItemQualquer] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
Ahan ... certissimo o Murilex ...
Algumas alteracos na ambiente podem ajudar:
- transformar os itens em ATIVOS;
- aumentar os timeouts (server e agent);
Na pratica o AGENTE nao consegue responder para o server (por carga ?!?!?) e temos esse erro ...
[]s,
Luciano