Ad Widget

Collapse

More than 100 items having missing data for more than 10 minutes

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • lfernandosg
    Member
    • Dec 2015
    • 90

    #1

    More than 100 items having missing data for more than 10 minutes

    Pessoal,

    Estamos recebendo essas mensagens a cada uma hora.

    Seguem configurações do meu servidor:
    Xeon 3.5ghz six core
    8GB ddr3
    100GB SAS 6GB/s raid 10 via hardware

    Estou somente com a metade do consumo de memória, processador em 12%.





    No terminal aparece:

    8326:20160819:033428.122 resuming SNMP agent checks on host "CONCENTRADOR-DC-1-B": connection restored
    8326:20160819:033928.410 resuming SNMP agent checks on host "RB750-SCANNET": connection restored
    8454:20160819:045246.078 executing housekeeper
    8454:20160819:045246.130 housekeeper [deleted 0 hist/trends, 0 items, 0 events, 0 sessions, 0 alarms, 0 audit items in 0.052307 sec, idle for 3 hour(s)]
    7666:20160819:063124.240 SNMP agent item "ifHCInOctets[L2LSerttelEPTTC]" on host "CONCENTRADOR-DC-1-B" failed: first network error, wait for 15 seconds
    8326:20160819:071439.829 resuming SNMP agent checks on host "UNIFI": connection restored
    7565:20160819:071619.133 SNMP agent item "ath0In" on host "UNIFI" failed: first network error, wait for 15 seconds
    8454:20160819:075247.320 executing housekeeper
    8454:20160819:075247.372 housekeeper [deleted 0 hist/trends, 0 items, 0 events, 0 sessions, 0 alarms, 0 audit items in 0.051791 sec, idle for 3 hour(s)]
    7794:20160819:084544.170 SNMP agent item "ifOperStatus[ether3]" on host "RB750-MAJESTOSA" failed: first network error, wait for 15 seconds
    Last edited by lfernandosg; 24-10-2016, 18:48.
  • Jefte
    Senior Member
    • Oct 2015
    • 207

    #2
    Vamos lá , você possue 96 equipamentos , com mais de 45mil itens sendo coletados , com 391VPS , é interessante você dar uma olhada se não esta coletando itens "desnecessários" coisas que você nem sabe que esta sendo coletado , sobre o alerta recebido :

    More than 100 items having missing data for more than 10 minutes
    mais de 100 itens que vc coleta estão sem ser coletados(nao respondem) a mais de 10minutos, isso pode ser decorrido do que eu falei acima , algum equipamento perde comunicação e vc fica sem esses itens , tente afunilar a sua coleta(aumentar o tempo de coleta tbm é o ideal) , pegar somente o necessário , agora se for necessario todos esses itens , terá de balancear esse servidor ai.

    Fique atendo sobre as noticias , nosso amigo hernandes martins (entre outros) , fazem alguns webinars sobre zabbix pra alto desempenho , pode lhe ajudar no seu cenário.

    Comment

    • lfernandosg
      Member
      • Dec 2015
      • 90

      #3
      O único ítem que é desnecessário são alertas de alterações de pontas PON da OLT fiberhome mas se eu preciso monitorar uma falha. Nesse caso, como faço para excluir os alertas de alteração das portas PON pois seu eu colocar "PON" na expressão regular ele vai excluir tudo.

      Obrigado

      Comment

      • Jefte
        Senior Member
        • Oct 2015
        • 207

        #4
        Você pode ir no host ou (no template geral dos hosts ) , e desativar ou excluir a trigger desnecessaria.

        Comment

        • lfernandosg
          Member
          • Dec 2015
          • 90

          #5
          Originally posted by Jefte
          Você pode ir no host ou (no template geral dos hosts ) , e desativar ou excluir a trigger desnecessaria.

          Estou vendo aqui que o maior número de ítens é na OLT mesmo. Tenho 2 unidades e só delas tem mais de 35.000 ítens. O pior é que não consigo remover o template snmp device delas para começar do zero e escolher só o que quero.

          Já desativei a descoberta mas ao tentar remover o template e ao clicar em atualizar a tela fica toda cinza e não remove.

          Comment

          • Jefte
            Senior Member
            • Oct 2015
            • 207

            #6
            Amigo , se possivel , comece seu servidor do zero , utilize somente as coletas necessarias.

            Comment

            • lfernandosg
              Member
              • Dec 2015
              • 90

              #7
              Originally posted by Jefte
              Amigo , se possivel , comece seu servidor do zero , utilize somente as coletas necessarias.

              Como faço para desativar um host, mesmo com o SNMP desativado, não consigo acho que por conta dos ítens.

              Comment

              • Jefte
                Senior Member
                • Oct 2015
                • 207

                #8
                Remove o host , e adicione o novamente , com os templates modificados.

                Comment

                • lfernandosg
                  Member
                  • Dec 2015
                  • 90

                  #9
                  Originally posted by Jefte
                  Remove o host , e adicione o novamente , com os templates modificados.

                  Esse é o problema. Não consigo remover o host ou os templates. A página fica cinza quando dou o comando e não finaliza.

                  Comment

                  • Jefte
                    Senior Member
                    • Oct 2015
                    • 207

                    #10
                    Recomece seu servidor do zero , é uma dica.

                    Comment

                    • lfernandosg
                      Member
                      • Dec 2015
                      • 90

                      #11
                      Originally posted by Jefte
                      Recomece seu servidor do zero , é uma dica.
                      Mesmo tentando recomeçar do zero, tenho muitos ícones e etc...então, eu precisaria remover os hosts e as OLts mesmo inativas não consigo remover os templates e nem o próprio host.

                      Comment

                      • Hernandes Martins
                        Senior Member
                        Zabbix Certified SpecialistZabbix Certified Professional
                        • Apr 2011
                        • 900

                        #12
                        Olá meu caro,

                        Neste caso, ajuste seu template, parece que está criando muitos itens desnecessários, essa demora que dá tela cinza, geralmente é porque ele está processando muitas informações(itens) e não consegue terminar devido ao timeout do php, se for o caso ajuste esse timeout.
                        Minha sugestão é ajustar o tempo de retenção dos dados no template e pedir para o zabbix excluir automaticamente, em último caso automatize via script com api do zabbix.

                        abraços
                        __

                        Att.
                        Hernandes Martins - Zabbix Trainer

                        Zabbix Brazil Partner - www.luniobr.com

                        Zabbix Brazil Community - www.zabbixbrasil.org

                        Blog: hernandesmartins.blogspot.com.br

                        Skype: hernandss
                        Telegram: @MrHernandes

                        Español
                        Facebook: facebook.com/groups/zabbixlatam
                        Telegram: https://t.me/ZabbixEspañol

                        Português
                        Facebook: facebook.com/groups/zabbixbrasil/
                        Telegram: https://t.me/ZabbixBrasil

                        Comment

                        • lfernandosg
                          Member
                          • Dec 2015
                          • 90

                          #13
                          Eu já desativei o host e no dashboard os vários ítens sumiram e mesmo assim não consigo remover o template do host. O template é o snmp device que uso em todos os outros normalmente. O problema é que esse equipamento é uma OLT que manda fibra para os clientes e agora não consigo remover nem a descoberta da interface do host para tentar remover o template do host. Simplesmente não deixa fazer nada. Tem alguma forma de remover o host ou o template dele via mysql?

                          EDITADO:

                          Consegui!!!

                          Fui em descoberta, network interfaces, protótipo de ítens e fui excluindo um por por um e aceitou. Despois, removi o template. Agora, 100% exceto pela fato do erro de espera de 15s mas tenho poucos ítens agora:

                          Quantidade de itens (habilitados/desabilitados/não suportados) 4451 3805 / 0 / 646

                          Tenho 3GB de memória livre, processador em 10% e os HDS são SAS 6GB/s raid 10 via hardware com 1GB de cache.


                          para minha máquina acredito ser pouco.
                          Last edited by lfernandosg; 07-09-2016, 14:59.

                          Comment

                          • Jefte
                            Senior Member
                            • Oct 2015
                            • 207

                            #14
                            Muito bem , é isso ai mesmo , o ideal é coletar somente o necessario (o que for usar para triggers ou graficos)

                            Comment

                            • antiqued4
                              Junior Member
                              • Nov 2018
                              • 11

                              #15
                              revivendo topico, alguem tem o template para monitorar fiberhome?

                              Comment

                              Working...