Ad Widget

Collapse

Problèmes Zabbix agent unreachable for 5min

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • zabbiuser
    Junior Member
    • Apr 2016
    • 10

    #1

    Problèmes Zabbix agent unreachable for 5min

    Bonjour tout le monde,

    Voilà je viens d'installer Zabbix pour monitorer des équipements réseaux.
    Seulement j'ai un problème, j'ai installé l'agent sur mon Zabbix Server et un autre serveur que je veux monitorer. En plus de cela je monitore une cinquantaine d'imprimantes et une soixantaine d'étiqueteuse.

    Après environ 50min, les agents de mes deux serveurs passent en "Zabbix agent on <nom du serveur> is unreachable for 5min".
    J'ai vérifé dans la Queue et ce problème survient quand j'ai un "bouchon" au niveau des requêtes, j'ai des items qui sont en attente de 5min à plus de 10min à partir de ce moment là les agents renvoient une erreur..

    Est-ce que cela veut dire que je monitore trop d'hosts ? Le soucis est que je n'ai pas fini de tous les ajouter.. Donc il y a-t-il une solution à cela ?

    Merci d'avance !
  • tiramiseb
    Senior Member
    • Sep 2012
    • 427

    #2
    Salut,

    Pour commencer :
    - quelle est la valeur « Performance serveur requise » sur le tableau de bord (dans la section « État de Zabbix ») ?
    - combien d'hôtes sont actuellement supervisés ?

    Je doute que tu supervises trop d'hôtes... il existe des parcs avec plusieurs dizaines (centaines?) de milliers d'équipements supervisés par Zabbix
    Par contre, peut-être que ton serveur de supervision est mal dimensionné ou mal configuré... Quelle est la configuration matérielle de la machine ?
    Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

    Comment

    • zabbiuser
      Junior Member
      • Apr 2016
      • 10

      #3
      Salut, merci de prendre en compte mon problème

      - La valeur « Performance serveur requise » est de : 19.57
      - Nombre d'hôtes supervisés : 174

      Oui c'est ce que je me suis dit vu que certains supervisent des milliers d'hôtes.

      Tu entends quoi par la configuration du matériel ? Le fichier zabbix_server.conf ?

      Je suis en stage donc je ne connais pas trop la configuration du matériel de l'entreprise.

      Comment

      • tiramiseb
        Senior Member
        • Sep 2012
        • 427

        #4
        19.57 c'est pas grand chose (ça correspond au nombre d'infos remontées par seconde, en moyenne).

        J'ai actuellement 47.11 (déploiement en cours, donc ça va augmenter), sur une machine avec un CPU Xeon E5-2676 et 2 Go de RAM et avec la base de données sur un autre serveur... et il y a de la marge !

        Tu entends quoi par la configuration du matériel
        CPU et mémoire, notamment :
        Code:
        cat /proc/cpuinfo
        free -m
        Il faudrait que tu approfondisses pour voir pourquoi ça "bouchonne" comme ça. Voir quels types de vérifications tu fais, combien de temps ça prend, etc.
        Tu peux également regarder l'évolution des indicateurs du serveur ou de Zabbix lui-même (il se supervise lui-même si tu utilises le bon template), pour mieux cibler d'où vient le problème.
        Last edited by tiramiseb; 21-04-2016, 13:30.
        Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

        Comment

        • zabbiuser
          Junior Member
          • Apr 2016
          • 10

          #5
          J'ai augmenté la valeur du StarterPoller, StarterPollerUnreachable dans le fichier zabbix-server.conf et il n'y a plus de problèmes.

          Par contre d'après les membres de l'équipe, Zabbix ralentit les étiqueteuses se trouvant dans l'entreprise. Est-ce que cela est possible ?

          Comment

          • tiramiseb
            Senior Member
            • Sep 2012
            • 427

            #6
            d'après les membres de l'équipe, Zabbix ralentit les étiqueteuses se trouvant dans l'entreprise. Est-ce que cela est possible ?
            C'est possible, si les requêtes que tu effectues font ramer le logiciel intégré à ces étiqueteuses.

            Cela étant dit, je n'ai pas du tout envie d'approfondir avec toi.
            Tu ne réponds pas aux questions que je te pose et tu trouves tes solutions tout seul, sans être sûr que c'est la bonne approche, là maintenant ça marche et si jamais c'est pas adapté sur le long terme tant pis, hein.

            Enfin bon, "là maintenant ça marche" c'est pas vraiment vrai non plus. Si tu fais ramer les étiqueteuses, c'est peut-être ça la cause de tes problèmes, en augmentant le nombre de pollers tu as probablement juste permis à zabbix d'être suffisamment patient... jusqu'au jour où tout pète.

            Mais bon, tu arrives à te débrouiller tout seul, alors je te laisse faire.
            Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

            Comment

            • zabbiuser
              Junior Member
              • Apr 2016
              • 10

              #7
              Je ne trouve pas des solutions tout seul, j'essaie de regarder toutes les solutions disponibles.
              J'ai vu que cela réglé chez certains, cela est peut-être "temporaire", donc j'ai transmis le message pour savoir si cela peut convenir et potentiellement avoir un avis positif ou négatif. Et voilà la réponse que j'ai
              Je pense que je n'irai plus demander d'avis sur les forums et je resterai avec mon/mes problèmes...

              Comment

              • tiramiseb
                Senior Member
                • Sep 2012
                • 427

                #8
                Voilà mon avis, il est négatif. Augmenter le nombre de pollers sans réfléchir, c'est clairement pas la voie à suivre et c'est écrit dans le manuel.


                General rule - keep value of this parameter as low as possible.


                J'ai demandé ton CPU, j'ai demandé ta mémoire, je t'ai dit dans quelle direction chercher.

                Tu n'as pas donné ces informations, tu n'as pas suivi cette direction, que veux-tu alors que je fasse de plus ?
                Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

                Comment

                • zabbiuser
                  Junior Member
                  • Apr 2016
                  • 10

                  #9
                  - Le modèle du CPU : Intel Xeon 5140
                  - La mémoire : 4Go de RAM (dont 3,6Go occupé)

                  Tu parlais du temps que prends les vérifications, en gros ça pourrait être ça vu que cela fait ralentir les étiqueteuses. Comment je peux vérifier combien de temps prenne les vérifications ?

                  Comment

                  • tiramiseb
                    Senior Member
                    • Sep 2012
                    • 427

                    #10
                    Originally posted by zabbiuser
                    - Le modèle du CPU : Intel Xeon 5140
                    - La mémoire : 4Go de RAM (dont 3,6Go occupé)
                    Ok, avec ce matériel tu ne devrais pas avoir ce genre de problème.

                    Originally posted by zabbiuser
                    Tu parlais du temps que prends les vérifications, en gros ça pourrait être ça vu que cela fait ralentir les étiqueteuses. Comment je peux vérifier combien de temps prenne les vérifications ?
                    Avec les vérifications internes, qui sont faciles à utiliser grâce au modèle d'hôte intégré, "Template Zabbix Server" je crois ou un truc comme ça (je suis dans le train, je n'ai pas accès à mon instance de Zabbix pour vérifier ça, pour le moment).


                    Je pense que tu peux notamment en premier te pencher sur la vérification "zabbix[process,<type>,<mode>,<state>]", peut-être avec précisément "zabbix[process,poller]" (il est fort possible que ce check soit déjà configuré dans le template sus-cité, encore une fois je ne peux pas vérifier pour le moment). Les autres vérifications du template en question peuvent t'être utiles également.


                    Si tu dis précisément de quelle manière tu fais les checks sur ces équipements (type de check (snmp peut-être ?), nombre de checks, paramètres, fréquence...) je peux éventuellement te donner un avis...
                    Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

                    Comment

                    • zabbiuser
                      Junior Member
                      • Apr 2016
                      • 10

                      #11
                      Avec les vérifications internes, qui sont faciles à utiliser grâce au modèle d'hôte intégré, "Template Zabbix Server" je crois ou un truc comme ça (je suis dans le train, je n'ai pas accès à mon instance de Zabbix pour vérifier ça, pour le moment).
                      https://www.zabbix.com/documentation...types/internal
                      Ok je vais regarder de ce côté alors

                      Si tu dis précisément de quelle manière tu fais les checks sur ces équipements (type de check (snmp peut-être ?), nombre de checks, paramètres, fréquence...) je peux éventuellement te donner un avis...
                      Les étiqueteuses sont checkées en SNMP v2 Agent ou v1 en fonction du type de SNMP que j'ai testé préalablement avec la commande snmpwalk.
                      J'utilise le template "SNMP Device", il y a plus ou moins 22 items avec des intervalles d'1min à 1h mais principalement 1min.
                      A part les serveurs où j'ai installé un agent Zabbix, tous les autres équipements sont checkés en SNMP

                      Comment

                      • tiramiseb
                        Senior Member
                        • Sep 2012
                        • 427

                        #12
                        Originally posted by zabbiuser
                        il y a plus ou moins 22 items avec des intervalles d'1min à 1h mais principalement 1min.
                        22 requêtes SNMP par minute, ça peut ralentir les machines, oui. Je te suggérerais d'augmenter l'intervalle.

                        Bien souvent, le SNMP est implémenté avec les pieds, malheureusement (sauf sur les routeurs haut de gamme, Cisco et compagnie, menfin ça te fait une belle jambe de savoir ça...)

                        Et sur ce qui est purement de l'alerting, tu peux éventuellement utiliser les traps SNMP pour faire du push (de manière générale je n'aime pas ça mais parfois y'a pas le choix)...
                        Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

                        Comment

                        • zabbiuser
                          Junior Member
                          • Apr 2016
                          • 10

                          #13
                          22 requêtes SNMP par minute, ça peut ralentir les machines, oui. Je te suggérerais d'augmenter l'intervalle.
                          Avec un intervalle de 5min au lieu de 1min, ça pourrait être bon selon toi ?

                          Bien souvent, le SNMP est implémenté avec les pieds, malheureusement (sauf sur les routeurs haut de gamme, Cisco et compagnie, menfin ça te fait une belle jambe de savoir ça...)
                          Effectivement, il y a environ 900 requêtes SNMP qui sont effectués sur les routeurs Cisco et il n'y a aucun ralentissement constaté
                          Last edited by zabbiuser; 22-04-2016, 09:49.

                          Comment

                          • zabbiuser
                            Junior Member
                            • Apr 2016
                            • 10

                            #14
                            J'ai modifié les template pour que les intervalles soient plus larges et j'ai également disabled certains items qui n'étaient pas "utiles" à checker pour les étiqueteuses.

                            J'ai constaté une nette amélioration sur le graph server performance du Zabbix server. Et j'ai regardé au niveau de l'history ça a l'air plus cohérent.
                            Sinon je regarderai du côté des traps SNMP.

                            Je vais attendre ce que cela donne et je reviendrai vers toi si c'est positif ou négatif

                            Ah et j'ai remis les valeurs de base pour le StarterPoller et autres, comme tu me l'as conseillé
                            Last edited by zabbiuser; 22-04-2016, 10:52.

                            Comment

                            • tiramiseb
                              Senior Member
                              • Sep 2012
                              • 427

                              #15
                              Très bien !

                              Malheureusement, sur ce genre d'équipements on ne peut pas être très "agressif" sur la supervision car ils n'ont pas été pensés pour ça...

                              Tu peux certainement affiner les intervalles, certaines infos peuvent peut-être se contenter de 10 minutes par exemple...
                              Last edited by tiramiseb; 22-04-2016, 10:54.
                              Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

                              Comment

                              Working...