Ad Widget

Collapse

Triggers ping cluster

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Akini
    Junior Member
    • Nov 2016
    • 27

    #1

    Triggers ping cluster

    Bonjour,
    Je viens de crée un Item pour ping plusieurs serveurs

    Donc en type d'items j'ai pris Zabbix aggregate et voilà a quoi il ressemble :

    grpavg[["grp_app_gamma"],"icmpping[{IPADDRESS1},2,20,30,60]",last,0]

    ValeurMoyenne[["grp_ou_sont-mes_serveurs"],"key",derniere valeur, 0tps]

    Visiblement il fonctionne, mais je coince sur la création du trigger, en gros je veux que quand les 5 serveurs dans le group me répondent qu'il n'y ai pas d'alerte, que lorsque 1 ne répond pas j'ai un warning, 2 ne ping pas une alerte mineur, etc !

    Pouvez-vous m'orienter?

    Merci d'avance !


    PS : Zabbix V2.4
  • SBO
    Zabbix Certified Specialist
    Zabbix Certified Specialist
    • Sep 2015
    • 226

    #2
    Hello,

    Ton item représente une moyenne de valeurs.. En l'état, je ne vois pas comment le système pourrait "deviner" qu'un (ou plusieurs) serveurs est down, en se basant uniquement sur cette valeur.
    Il te faudrait plutôt un item qui te dit "si server up, then 0, sinon 1", et tu fais un grpavg là-dessus.. Ensuite tu crées tes triggers selon le chiffre obtenu (0=ok, 1 = 1 serveur down, etc..)
    Last edited by SBO; 20-02-2017, 15:17.

    Comment

    • Akini
      Junior Member
      • Nov 2016
      • 27

      #3
      Pour y revenir, l'item ne fonctionne pas de tout de manière... je suis novice dans zabbix et je m’efforce tant bien que mal de comprendre avec la documentation mais c'est pas simple!

      En fait j'ai déjà un items pour ping : icmpping[{IPADDRESS1},2,20,30,60]
      mais comment lui faire renvoyer une valeur 0 ou 1?

      D'autre part je ne sais pas si c'est liée à cette erreur de remonté de 0/1 mais la variable n'est pas reconnue dans la key de l’item qui précède..

      Merci pour ta réponse!

      Comment

      • tiramiseb
        Senior Member
        • Sep 2012
        • 427

        #4
        icmpping, quand il fonctionne retourne 0 si l'adresse visée est injoignable ou 1 si elle est joignable.

        ensuite, tu peux faire un grpsum (et non grpavg) pour additionner les retours de tous ces "icmpping" : ça fera une valeur qui est égale à la somme des serveurs qui ont répondu au ping.
        Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

        Comment

        • tiramiseb
          Senior Member
          • Sep 2012
          • 427

          #5
          Si tu veux utiliser icmpping, as-tu bien installé fping sur ton serveur ?

          Ensuite, as-tu vraiment besoin de spécifier des valeurs en argument ? Peut-être peux-tu te contenter d'appeler icmpping sans aucun argument :
          Code:
          icmpping[]
          Si tu es novice, commence par des choses simples


          Oh, encore autre chose : avant de définir l'aggrégation, tu dois définir le check unitaire pour chacun des serveurs hein... Donc icmpping doit exister pour chacun des hôtes, c'est pas magique.
          J'ai l'impression que tu n'as défini que l'aggrégation, là...
          Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

          Comment

          • SBO
            Zabbix Certified Specialist
            Zabbix Certified Specialist
            • Sep 2015
            • 226

            #6
            Merci tiramiseb, j'étais en train de corriger mon post entre deux meetings, tu m'as devancé

            Comment

            • Akini
              Junior Member
              • Nov 2016
              • 27

              #7
              Effectivement je suis novice x)


              icmpping est bien présent dans tout mes host serveur. j'ai donc modifier mon item de mon host-group en :

              grpsum[["grp_app_gamma"],icmpping,last,0]

              Celui-ci fonctionne et me remonte bien des données!

              En revanche mon host-group ne contiens que 5 serveurs et mon item me remonte des donnée tel que "18" ou "19".

              J'en conclue que le icmpping envoie 4 paquets par serveur et me remonte +1 pour chaque réponse de paquet donc?

              Merci pour vos réponses



              Edit : Mon item a fonctionné quelques minutes avant de me dire "not supported"..

              Quand je regarde mes lastest value une par une pour chaque serveur il me remonte bien la valeur 1 quand il le ping. Pourquoi quand je fait la somme de ceux-ci il me donne une valeur égale à 18/19/20?
              Last edited by Akini; 20-02-2017, 16:40.

              Comment

              • tiramiseb
                Senior Member
                • Sep 2012
                • 427

                #8
                Je ne suis pas sûr que ça vient de là (au contraire, je pense que ça ne changerait rien), mais essaye comme ça, au cas où :

                Code:
                grpsum[grp_app_gamma,icmpping,last]
                Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

                Comment

                • Akini
                  Junior Member
                  • Nov 2016
                  • 27

                  #9
                  Je ne peut pas utiliser cette syntaxe :

                  Key "grpsum" does not match <grpmax|grpmin|grpsum|grpavg>["Host group(s)", "Item key", "<last|min|max|avg|sum|count>", "parameter"].

                  Comment

                  • tiramiseb
                    Senior Member
                    • Sep 2012
                    • 427

                    #10
                    Peut-être une erreur dans ma syntaxe...

                    Peut-être ça :
                    Code:
                    grpsum["grp_app_gamma","icmpping[]",last]
                    J'utilise peu les aggrégations, j'arrive pas à trouver la bonne syntaxe du premier coup
                    Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

                    Comment

                    • Akini
                      Junior Member
                      • Nov 2016
                      • 27

                      #11
                      Merci pour ton aide!

                      grpsum["grp_app_gamma","icmpping[]",last,""]

                      il ne fonctionne pas ni l'un ni l'autre pars que après le "last", il y a les paramètre comme ci-dessus. Effectivement les items fonctionne de cette manière mais il fonctionne que quelques minutes !

                      Petite synthese de tout ça :

                      J'ai dans le groupe 'grp_app_gamma' 5 serveurs, les 5 serveurs sont supervisé pour le ping avec l'item "icmpping[{IPADDRESS1},2,20,30,60" en simple check avec un intervalle de 50 sec
                      Il le sont aussi pour tout un tas de choses tel que la place disponible sur les disque dur "vfs.fs.size[C:,pfree]", la mémoire, le processeur, et un item de découverte au cas ou on y rajoute un disque dur dessus.


                      Aujourd'hui je veux les supervisé de façon plus générale, car en effet lorsque un serveur tombe je suis informé, mais nous avons beaucoup d'équipements!
                      Bref ces 5 serveurs constitue un cluster et le but est de le supervisé de ce point de vue et non pas un par un.

                      Déjà suis-je sur la bonne route pour faire une tel supervision? En effet les agrégats me semblé une bonne solution pour supervisé ceux-ci avec justement leur remonté de 0 et de 1 lorsque le ping fonctionne (et celui-ci fonctionne pour chacun d'eux, il me remonte bien la valeur 1 pour chaque ping dans les dernières données de chacun des serveurs, si je regarde les donnée de haque serveur 1 par 1). Je croie donc que si j'arrive a faire la somme des 5 ping des 5 serveur je pourrais ensuite faire des triggers en fonction du résultat de cette somme!

                      Es-ce la bonne solution déjà?

                      Si c'est le cas, lorsque je crée mon item de tel manière

                      grpsum[["grp_app_gamma"],icmpping,last,0]
                      grpsum[grp_app_gamma,icmpping,last,0]
                      grpsum["grp_app_gamma","icmpping[]",last,""]

                      L'item va fonctionner 3 minutes avant de me remonter "not supported"..

                      Comment

                      • tiramiseb
                        Senior Member
                        • Sep 2012
                        • 427

                        #12
                        Originally posted by Akini
                        après le "last", il y a les paramètre comme ci-dessus.
                        Si les paramètres sont vides, il n'y a pas besoin de les préciser...


                        Originally posted by Akini
                        l fonctionne que quelques minutes !
                        Et il ne dit pas pourquoi il ne fonctionne plus, après ?

                        Il dit juste "unsupported" ? Peut-être y a-t-il quelque chose dans les logs du serveur zabbix...


                        Originally posted by Akini
                        J'ai dans le groupe 'grp_app_gamma' 5 serveurs, les 5 serveurs sont supervisé pour le ping avec l'item "icmpping[{IPADDRESS1},2,20,30,60"
                        Et pourquoi pas simplement "icmpping[]" ?


                        Originally posted by Akini
                        intervalle de 50 sec
                        Aussi court que ça ? Pourquoi pas 1 minute ? Voire 2 ou 5 minutes... Le mieux est l'ennemi du bien...

                        Originally posted by Akini
                        Bref ces 5 serveurs constitue un cluster et le but est de le supervisé de ce point de vue et non pas un par un.

                        Déjà suis-je sur la bonne route pour faire une tel supervision?
                        Oui.
                        Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

                        Comment

                        • Akini
                          Junior Member
                          • Nov 2016
                          • 27

                          #13
                          1. Effectivement il n'y a pas besoin de préciser les paramètre quand il n'y en as pas mais il faut lui les précisé avec deux "" pour lui dire qu'il n'y en as pas visiblement, sinon il m'est impossible de le mettre a jour ou d'ajouter l'item.


                          2. Non il fonctionne au début, "enable", puis quelques minutes après il passe en "not supported" sans explications!

                          Edit : Explication du not supported : No items for key "icmpping[]" in group(s) "grp_app_gamma"
                          J'immagine que c'est parsque la clef utiliser pour ping mes serveur est "icmpping[{IPADDRESS1},2,20,30,60" mais cela n'explique pas ourquoi il fonctionne un temps puis n'est plus supporter enssuite!

                          \\Try Hard//

                          3. "icmpping[{IPADDRESS1},2,20,30,60" l'item est de cette façon car nous supervisons quelques millier d'équipements et qu'avec une variable c'est plus simple d'utilisation que si nous devions faie une item par équipement! Les paramètres ont était décidé de façon a se que lorsque l'on utilise le ping il envoie 2 paquets à 20milisecondes d'écart, d'une taille de 30 bits avec un timeout de 60.
                          pourquoi cette décision? je vais en parler avec mon responsable pour avoir plus d’information.


                          4. Pour ce qui est de la durée de 50secondes, c'est parsque nous ne pouvont pas nous permettre d'avoir l'information que le serveur est tombé que 5 minutes après, cela impacterai des milliers d'utilisateurs !


                          5. Si je suis sur la bonne route alors je pense que l'erreur provien surement de la key dans l'item en effet je place une key "icmpping[]" alors que la mienne correspond a "icmpping[{IPADDRESS1},2,20,30,60"

                          Le problème ici est que Zabbix ne reconnais pas ma variable quand je place cette key dans mon item agrégat.
                          L'item que je tente de crée ne doit-il pas avoir pour clef l'item exacte utiliser pour le ping en temps normal?

                          Edit : Pour rappel je suis en Zabbix V2.4
                          Last edited by Akini; 21-02-2017, 11:32.

                          Comment

                          • Akini
                            Junior Member
                            • Nov 2016
                            • 27

                            #14
                            Autre piste sur laquel il est fort probable que je me soit tromper.. J'ai crée un host "Application_gamma" pour que ce soit lui qui me remonte ces informations, celui-ci fait parti du groupe "Application" et "grp_app_gamma".

                            Agent interfaces
                            IP address :0.0.0.0
                            DNS name :
                            Connect to : IP
                            Port : 10050
                            Default : Cocher


                            L'erreur viens peut-être de la, mais que mettre si ce n'est ceci car je n'ai pas d'adresse ip précise (hors mis les IP de mes serveurs), j'ai crée ce host pour que se soit lui qui me remonte les informations !



                            Edit : j'ai essayer de faire la moyenne de la charge CPU et cela fonctionne :

                            grpavg[["grp_app_gamma"],"system.cpu.util[,,avg5]",last,""]

                            L’erreur est donc bien dans mon item de somme pour le ping!
                            Last edited by Akini; 21-02-2017, 13:07.

                            Comment

                            • tiramiseb
                              Senior Member
                              • Sep 2012
                              • 427

                              #15
                              Originally posted by Akini
                              1. Effectivement il n'y a pas besoin de préciser les paramètre quand il n'y en as pas mais il faut lui les précisé avec deux "" pour lui dire qu'il n'y en as pas visiblement, sinon il m'est impossible de le mettre a jour ou d'ajouter l'item.
                              Nope. Le champ peut être purement et simplement vide et les virgules inutiles peuvent être ignorées.

                              Originally posted by Akini
                              Edit : Explication du not supported : No items for key "icmpping[]" in group(s) "grp_app_gamma"
                              J'immagine que c'est parsque la clef utiliser pour ping mes serveur est "icmpping[{IPADDRESS1},2,20,30,60"
                              Il faut bien évidemment que dans l'agrégation tu utilises exactement la clé définie sur l'hôte ! Sinon il ne sait pas quoi agréger...

                              Je réitère ce que j'ai déjà demandé plus haut : pourquoi ne pas utiliser, sur les hôtes, simplement "icmpping[]" ?

                              Originally posted by Akini
                              cela n'explique pas ourquoi il fonctionne un temps puis n'est plus supporter enssuite!
                              C'est le temps qu'il s'en rende compte.


                              Originally posted by Akini
                              3. "icmpping[{IPADDRESS1},2,20,30,60" l'item est de cette façon car nous supervisons quelques millier d'équipements et qu'avec une variable c'est plus simple d'utilisation que si nous devions faie une item par équipement!
                              Gné ? "icmpping[]" tu le mets tel quel dans le template et t'as aucune variable à utiliser...


                              Originally posted by Akini
                              Les paramètres ont était décidé de façon a se que lorsque l'on utilise le ping il envoie 2 paquets à 20milisecondes d'écart, d'une taille de 30 bits avec un timeout de 60.
                              Ok bah dans ce cas si tu as besoin précisément de ces paramètres-là, utilises-les. Mais c'est pas évident à paramétrer icmpping, certains s'y sont cassé les dents.

                              Essaie alors :

                              Code:
                              icmpping[,2,20,30,60]
                              et reprend exactement la même syntaxe dans l'agrégation que celle de l'hôte !

                              Originally posted by Akini
                              Pour ce qui est de la durée de 50secondes, c'est parsque nous ne pouvont pas nous permettre d'avoir l'information que le serveur est tombé que 5 minutes après, cela impacterai des milliers d'utilisateurs !
                              Pourtant tu parles d'un cluster, donc j'imagine qu'il y a de la répartition de charge, et si c'est bien géré alors la perte d'un serveur doit être indolore.
                              Traducteur principal de Zabbix en français ces derniers temps - Blog personnel - Boutique de domotique "DIY"

                              Comment

                              Working...