Ad Widget

Collapse

Link UP ou DOWN

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Helio
    Member
    • Oct 2012
    • 43

    #1

    Link UP ou DOWN

    E ai rapaziada...

    Novamente cá estou com mais uma dúvida a respeito de como criar um host/trigger para monitorar se os links do cliente estão ON ou OFF.

    Estou postando pois não achei esse tópico presente em outro lugar.

    A situação é a seguinte, meu cliente tem 2 links de internet para redundância e o mesmo pediu se não teria como monitorar esses links, pois esses dias uma das empresas ligou pra ele pedindo desculpas pelo incomodo de ter ficado sem link durante 2 horas e como o mesmo tem essa redundancia, ele só ficou sabendo por esse aviso..

    Lendo em alguns lugares vi que dava para criar um host com o template STANDALONE, conforme as figuras abaixo:




    Meus Itens no cliente:


  • Helio
    Member
    • Oct 2012
    • 43

    #2
    continuacao!

    Sendo assim eu conseguiria verificar.. o problema é que no mapa fica em vermelho, assim como no host:


    Porém, criei tambem gráficos para mostrar se esta ON ou OFF para o cliente ver e os mesmos mostram que esta ok:



    Alguma dica para arrumar isso ai? seria alguma sintaxe incorreta no template?

    Obrigado desde já!

    Comment

    • eterjack
      Member
      Zabbix Certified Specialist
      • Mar 2012
      • 60

      #3
      Opa, boa noite Helio....

      Acredito, o zabbix esteja em uma rede atrás dos links, saindo pela internet por esse balanceamento certo ? Vou partir desse principio para dar uma ideia.

      O "Monitoramento Simples" que existe no zabbix tem sempre como origem o zabbix server, ou Zabbix Proxy. Dessa forma o icmpping utilizando apenas o Zabbix Server, não seria uma boa opção a menos que voce queria mexer com roteamento.

      Uma outra opção seria, instalar um Zabbix Proxy, e configurar no gateway da rede que está realizando o balanceamento, o seguinte:

      Zabbix Server -> Sai pelo Link A.
      Zabbix Proxy -> Sai pelo Link B.

      Existem também a possibilidade de criar um scripts, e executa-lo pelo parameterUser do agente do zabbix, de uma máquina que saia pelo link diferente do Zabbix.

      Existem várias possibilidades, espero ter ajudado.

      Abraços...

      Comment

      • Helio
        Member
        • Oct 2012
        • 43

        #4
        Opa, valeu pela dica eter, mas o meu "problema" é bem mais simples que isso..

        Se eu tivesse uma máquina que ficasse pingando 100% do tempo esses 2 links e a partir de um momento que um link caia ela disparasse um apito, pra mim ja seria o suficiente..

        O que eu procurei nesse simple check é justamente falar se o link esta funcionando ou não, não quero fazer nada com eles, mesmo porque a própria empresa manuseia o firewall e proxy que la estão..

        Então minha meta seria bem isso, "pingar" pra ver se responde ou não e eu procurei no zabbix isso pois fica mais fácil e "didático" para o cliente ver se ta funcionando ou não o link dele!!

        Comment

        • eterjack
          Member
          Zabbix Certified Specialist
          • Mar 2012
          • 60

          #5
          Humm tem como voce detalhar mais como esta essa topologia ?

          Por exemplo:

          O zabbix monitora esses links externamente ?
          O zabbix esta atras desses dois links, com um firewall entre ele e os links ?

          Etc..

          Comment

          • Helio
            Member
            • Oct 2012
            • 43

            #6
            A topologia dele está assim:

            minha empresa - zabbix proxy instalado no cliente - agents nos computadores

            será que eu teria que indicar esses 2 simple check no proxy também? por exemplo, na minha configuração eles não estão incluídos o proxy, apenas o grupo que essa empresa está.. pensei em colocar mas ao mesmo tempo não coloquei pensando que como era um serviço apenas de pingar e obter resposta, não precisaria passar pelo proxy.. o que acha?

            Comment

            • Helio
              Member
              • Oct 2012
              • 43

              #7
              Bom, nem sei se eu mexi certo lá, pois não entendo muito bem sobre esses comandos, mas vi em um site falando sobre a quantidade de tentativas em N..

              fonte: http://www.stato.blog.br/wordpress/?p=590

              Bom, sendo assim lá fui eu trocar a sintaxe da trigger pra 4:

              {Link Telefonica:icmppingsec.last(0)}=4

              e ele está aparentemente funcionando... está no meu mapa OK, porém no host ele continua com a mesma imagem de não encontrado!!

              o que achei interessante é que segundo o nosso amigo ai do link que postei, assim que ele faz esse icmppingsec o gráfico dele gerado é todo irregular, já o meu é uma reta só conforme gráfico já postado anteriormente =/

              Pedi para meu cliente se podemos fazer um teste de derrubar um dos links dele para ver se está reportando e assim que o mesmo fizer venho aqui postar se realmente deu certo!

              Comment

              • eterjack
                Member
                Zabbix Certified Specialist
                • Mar 2012
                • 60

                #8
                Boa tarde,

                {Link Telefonica:icmppingsec.last(0)}=4

                Significa que o last(0) ou seja o ultimo valor coletado é igual a 4. Ou seja a trigger só será ativada quando last(0) for 4, por isso ela ativou.

                icmppingloss.min(120)}>99 ou seja, se nos ultimos 120 segundos você tiver menores valores > 99% de perda de pacotes, a trigger ira alertar.

                Nesse link tem alguns exemplos:
                http://www.zabbix.com/documentation/...onfig/triggers

                Para realizar o monitoramento desses links, o ideal seria voce pingar o ip valido de cada um desses links, a partir do Zabbix Server. Normalmente seria o ip externo do Firewall.

                Comment

                • m_gularte
                  Member
                  Zabbix Certified Specialist
                  • Jul 2012
                  • 85

                  #9
                  Creio estar havendo uma confusão entre verificação de disponibilidade (0 ou 1 - icmpping) e latência (icmppingsec). E outra, esse resultado do icmpping não é em milisegundos, o valor sempre será 0 ou 1, assim como um ping normal.
                  As triggers devem ser diferentes para os dois

                  No primeiro caso a trigger deveria ser {Link Telefonica:icmpping.last(0)}=0, se o valor 0 ocorrer, significa que o ping parou de responder no link em questão e a trigger será ativada.
                  Porém desta forma muitos falsos positivos podem ocorrer (qualquer instabilidade no link), neste caso recomendo, por exemplo: {Link Telefonica:icmpping.sum(#2)}=0 ou {Link Telefonica:icmpping.sum(60)=0. Um usa contadores e outro usa tempo em segundos.

                  Se você usar {Link Telefonica:icmppingsec.last(0)}=4 esta trigger possui mais serventia para alertar "lentidão" no link. E ainda sim, não deveria ser =4 e sim >4 (isso para lentidão).

                  Mas antes de mais nada, eu recomendaria você ter certeza que o ping está funcionando corretamente no servidor zabbix. Dentro da console digitar:

                  ping IP
                  fping IP

                  Fazer o mesmo procedimento nos dois IPs. As quatro checagens deveriam voltar OK.

                  Comment

                  • Helio
                    Member
                    • Oct 2012
                    • 43

                    #10
                    Obrigado aos que me responderam...

                    primeiramente eu realmente nao entendo dessas triggers então fica dificil pra cabeça dura aqui sacar, porém como foi pedido, efetuei os testes de ping e fping a partir do servidor e ambos deram respostas positivas, o fping falou que esta alive e o ping respondeu normalmente...

                    Bom, eu coloquei agora a expressão: {Link Telefonica:icmpping.sum(60)}=0 conforme foi falado e deu ok, vamos ver como se comporta agora..

                    Eu gostei da idéia de ambas as triggers, mas quando coloco conforme o eter indicou {Link Telefonica:icmppingloss.min(120)}>99 ele da erro de expressão, fica tanto vermelho quando aparece a msg

                    Incorrect item key "icmppingloss" provided for trigger expression on "Link Telefonica".

                    Obrigado por enquanto galera, tão me ajudando demais mesmo!! Vou ler mais sobre essas triggers e ver se entendo!

                    p.s: mesmo se a expressão estiver funcionando, é normal que nos meus hosts ele continue sem marcar aquele Z verde? por sinal não tem marcação nenhuma, apenas está escrito monitorado, assim como os gráficos estão da mesma forma..
                    Last edited by Helio; 13-11-2012, 15:35.

                    Comment

                    • m_gularte
                      Member
                      Zabbix Certified Specialist
                      • Jul 2012
                      • 85

                      #11
                      Então...

                      Por exemplo, você pode ter diversas triggers que fazem a mesma coisa:

                      .last(0)}=0 (se o último valor for igual a zero)
                      .last(0)}#1 (se o último valor for diferente de 1)
                      .last(0)<1 (se o último valor for menor que 1)

                      Pois "0 - ICMP ping fails. 1 - ICMP ping successful."

                      {Link Telefonica:icmpping.sum(60)}=0 (se os valores dentro de 60 segundos forem iguai a zero - isso se seu ping estiver configurado para 30 segundos)
                      {Link Telefonica:icmpping.sum(#2)}=0 (se os últimos dois valores forem iguais a zero - eu prefiro essa)

                      Enfim,

                      Sobre esses ícones na direita de cada host, eles significam:

                      agente zabbix - quando você instala o agente em um pc / servidor ele usa a porta 10050, basta dar um telnet ip_do_servidor 10050 e se a conexão fechar é porque está funcionando, se não funcionar é porque o agente não subiu ou algum firewall no caminho. Vale lembrar que você tem de configurar o arquivo agentd.conf e adicionar o ip do seu servidor zabbix. Caso contrário o ícone ficará vermelho.

                      snmp - quando você configura um firewall, switch, access point, roteador, etc. Você define uma "community", um nome (geralmente public) e é desta forma que o zabbix coleta as informações, por meio da porta 161. Porém o telnet não funciona nesse caso, você terá de usar o snmpwalk a partir do servidor zabbix e digitar snmpwalk -v2c -c nome_da_communit ip_do_dispositivo. Se voltar um monte de texto significa que o snmp está configurado certo e funcionando.

                      Seu host "link telefonica" deve estar com o ícone vermelho por que você adicionou 9 itens nele, e provavelmente esses itens são do tipo agente e não do tipo snmp.

                      Os itens do tipo checagem simples (pings) não possuem ícone para dizer se estão funcionando ou não, você pode verificar se estão funcionando entrando nos itens e vendo o status deles, se estiver como não suportado, algo no item está errado.

                      E por fim, esse erro que você recebeu ao criar essa trigger "Incorrect item key "icmppingloss" provided for trigger expression on "Link Telefonica" provavelmente é porque você não possui esse item no host, apenas o icmpping e o icmppingsec, teria de adicionar o icmppingloss para poder criar uma trigger para ele...

                      Bom, muita coisa para explicar =p melhor começar a ler o manual ^^.

                      Flw

                      Comment

                      • sosmicro
                        Junior Member
                        • Nov 2012
                        • 2

                        #12
                        Originally posted by m_gularte
                        Então...


                        Os itens do tipo checagem simples (pings) não possuem ícone para dizer se estão funcionando ou não, você pode verificar se estão funcionando entrando nos itens e vendo o status deles, se estiver como não suportado, algo no item está errado.



                        Bom, muita coisa para explicar =p melhor começar a ler o manual ^^.

                        Flw
                        Olá m_gularte...
                        estava com a mesma dúvida do Hélio. Procurei no manual algo a respeito e só fui encontrar a confirmação neste seu post...
                        Para que o ícone fique verde é preciso que o agente do zabbix esteja rodando no host monitorado. Quando o template standalone é usado, ou não existir agente no host, qualquer item que seja monitorado (pelo template standalone) não fará o icone do AGENTE ficar verde... correto???

                        []s

                        Comment

                        • m_gularte
                          Member
                          Zabbix Certified Specialist
                          • Jul 2012
                          • 85

                          #13
                          Olá!

                          Então...

                          Sim para ambos os questionamentos!

                          Pode fazer um teste, adicione um host qualquer com um ip que responda a ping e adicione apenas o template standalone. Após algum tempo várias triggers serão acionadas, porém, o ícone do host continuará sem alteração de cor. Ele não vai dizer que está fora, nem que está ok... Ele fica neutro. Mas ele está sendo monitorado. Basta ir em monitoramento / dados recentes, procurar seu host lá e verificar que o monitoramento está ocorrendo a cada 60 segundos e ver inclusive os gráficos e últimos valores.

                          Agora, se você tem o agente instalado ou o snmp configurado e adicionar o template correto, o ícone deveria sim ficar verde (se a comunicação e configuração estiver correta). Se em algum momento durante o monitoramento ao longo dos dias o ícone ficar vermelho é por que o agente ou snmp parou de funcionar por algum motivo. Resta achar, corrigir e o ícone ficará verde novamente.

                          Enfim... =)

                          Comment

                          • Helio
                            Member
                            • Oct 2012
                            • 43

                            #14
                            Sucesso!

                            É isso mesmo que o Gularte falou... eu fiz aqui a trigger conforme o amigo me passou:

                            {Link Telefonica:icmpping.sum(60)}=0

                            E funcionou como deveria... caiu esse final de semana e alertou como deveria.. conclusão, cliente feliz demais

                            Obrigado a todos que me ajudaram!!

                            Comment

                            • Helio
                              Member
                              • Oct 2012
                              • 43

                              #15
                              Parou de funcionar?

                              E ai galera tranquilo?

                              Estava funcionando perfeitamente esse item ai quando hoje de manha os links que eu tinha setado esse item cairam... mas eles estão UP, zuado né..

                              bom, perguntei para meu chefe se ele tinha feito alguma coisa no firewall, nem sei se isso daria algum conflito mas de qualquer forma né.. de qualquer forma ele falou que não mexeu (sendo ele o unico que tem acesso ao mesmo).

                              Alguém saberia me dizer o que pode ou poderia estar acontecendo??

                              Olhei nos logs e está normal, não esta falando nada que aconteceu...

                              Comment

                              Working...