Ad Widget

Collapse

Coleta SNMP falha

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • yrvayne
    Junior Member
    • Jun 2014
    • 2

    #1

    Coleta SNMP falha

    Instalei um zabbix 2.2.3 em um servidor e ativei o monitoramento SNMP versão 2 em algumas maquina na rede, porém de tempos em tempo o zabbix não consegue coletar os dados e no gráfico fica literalmente com buracos (sem parte da informação).

    Verifiquei e o servidor fica praticamente todo o tempo com no máximo 5% de processamento e esta com mais de 1Gb de memória disponível, além dos 2 GB de swap que não são utilizada.

    O estranho é que essa falha somente ocorre com o snmp e agente do zabbix esta operando normalmente.

    Não há nenhum bloqueio de rede, inclusive os computadores que estão sendo monitorados estão no mesmo seguimento de rede.

    Alterei o tempo de coletas achando que isso poderia estar sobrecarregando o zabbix, mesmo assim ele continua falhando algumas vezes na coleta dos dados.

    Atualmente isso ocorre mesmo monitorando somente 9 maquinas com 8 itens cada uma, a coleta é feita a cada 60 segundos e algumas de 10 em 10 minutos.

    Alguém sabe o que pode estar ocorrendo?
  • harmonica
    Senior Member
    • Jan 2009
    • 251

    #2
    Olá,

    Dá uma vista de olhos no ficheiro zabbix_server.log. Pode conter alguma informação importante que possa explicar esse comportamento.

    Comment

    • yrvayne
      Junior Member
      • Jun 2014
      • 2

      #3
      Harmonica,
      coletei os logs e eles indicam que o host esteve indisponível na interface de rede, porém o host não apresentou falha de rede em nenhum momento. O servidor também não apresentou falha de rede em nenhum momento.
      Segue abaixo os logs de erro:
      -------------------------------------------------------------------------------------------
      1745:2014/07/02 = 17:00:31.428 SNMP agent item "ifDescr" on host "Teste" failed: first network error, wait for 15 seconds
      1749:2014/07/02 = 17:00:55.694 SNMP agent item "ifDescr" on host "Teste" failed: another network error, wait for 15 seconds
      1749:2014/07/02 = 17:01:22.711 temporarily disabling SNMP agent checks on host "Teste": host unavailable
      1749:2014/07/02 = 17:02:22.744 enabling SNMP agent checks on host "Teste": host became available
      1760:2014/07/02 = 17:35:07.388 executing housekeeper
      1760:2014/07/02 = 17:35:07.656 housekeeper [deleted 4508 hist/trends, 0 items, 0 events, 0 sessions, 0 alarms, 0 audit items in 0.267159 sec, idle 1 hour(s)]
      1746:2014/07/02 = 18:00:31.658 SNMP agent item "ifDescr" on host "Teste" failed: first network error, wait for 15 seconds
      1749:2014/07/02 = 18:00:55.548 SNMP agent item "hrProcessorLoad" on host "Teste" failed: another network error, wait for 15 seconds
      1749:2014/07/02 = 18:01:19.567 temporarily disabling SNMP agent checks on host "Teste": host unavailable
      1749:2014/07/02 = 18:02:19.583 enabling SNMP agent checks on host "Teste": host became available
      1760:2014/07/02 = 18:35:07.656 executing housekeeper
      1760:2014/07/02 = 18:35:07.921 housekeeper [deleted 4508 hist/trends, 0 items, 0 events, 0 sessions, 0 alarms, 0 audit items in 0.263982 sec, idle 1 hour(s)]
      1748:2014/07/02 = 19:00:31.069 SNMP agent item "hrProcessorLoad" on host "Teste" failed: first network error, wait for 15 seconds
      1749:2014/07/02 = 19:00:55.408 SNMP agent item "hrProcessorLoad" on host "Teste" failed: another network error, wait for 15 seconds
      1749:2014/07/02 = 19:01:19.425 temporarily disabling SNMP agent checks on host "Teste": host unavailable
      1749:2014/07/02 = 19:02:19.441 enabling SNMP agent checks on host "Teste": host became available
      1747:2014/07/02 = 19:23:55.946 SNMP agent item "1.3.6.1.2.1.25.3.3.1.2" on host "Teste" failed: first network error, wait for 15 seconds
      1749:2014/07/02 = 19:24:13.666 SNMP agent item "1.3.6.1.2.1.25.3.3.1.2" on host "Teste" failed: another network error, wait for 15 seconds
      1749:2014/07/02 = 19:24:31.677 SNMP agent item "sysUpTime" on host "Teste" failed: another network error, wait for 15 seconds
      1749:2014/07/02 = 19:24:49.684 temporarily disabling SNMP agent checks on host "Teste": host unavailable
      1749:2014/07/02 = 19:26:52.748 enabling SNMP agent checks on host "Teste": host became available

      --------------------------------------------------------------------
      Você consegue me ajudar com esses logs?

      Em alguns hosts a falha acontece exatamente a cada 1 hora, como se a aplicação falhasse a cada determinado período

      Comment

      • Porto97
        Junior Member
        • Jan 2014
        • 4

        #4
        A mim acontece-me o mesmo o pior é que esse tempo que fica sem receber dados faz-me disparar os triggers e la vão mails e sms com falsos. positivos

        a diferença e que não me acontece com intervalos certos pode ficar 2 ou 3 dias sem problemas e de repente fica assim.

        Comment

        • emersonrta
          Member
          Zabbix Certified Specialist
          • Aug 2010
          • 36

          #5
          Amigo,

          Não basta verificar apenas processamento e memória. Como está a sua fila de disco?
          Todos os hosts que você está monitorando estão na mesma rede física? Se estiverem você deve estar com algum problema de rede, pois não é normal o Zabbix apresentar a mensagem de network error.
          Este erro só é apresentado quando o zabbix tenta buscar informação em um host e esse host não é encontrado, como é mostrado no seu log.

          Comment

          Working...