Ad Widget

Collapse

Perte de l'agent

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Icoari
    Junior Member
    • Feb 2018
    • 1

    #1

    Perte de l'agent

    Bonjour tout le monde,

    j'ai fait un rapide tour sur le forum, mais je n'ai rien trouvé de semblable, je me permets donc de faire un nouveau topic.

    Etat des lieux :

    Récemment, ma société a décidé d'installer un environnement de REC zabbix en plus de l’environnement actuel de PRD.

    Dans ma config agent, j'ai donc :

    server : SRVPRDZAB.domaine.com,SRVRECZAB.domaine.com
    server active : SRVPRDZAB.domaine.com,SRVRECZAB.domaine.com

    Les deux Zabbix supervisent les mêmes machines (environs 400 serveurs et 200 machines client)

    Problème :

    j'ai donc sur tous les postes un Item : agent.ping avec deux triggers :

    Indisponible depuis 15 min {Agent:agent.ping.nodata(900)}=1
    Indisponible depuis 30 min {Agent:agent.ping.nodata(1800)}=1

    Pour 90% des serveurs pas de soucis, pour les 10% restants, il arrive très régulièrement (10x par jours ) que les Triggers se déclenche en REC (mais jamais en PRD).

    En gros mon Zabbix de REC n'arrive plus à contacter le serveur ou la machine pendant 15 min, 1h, parfois même 3 ou 4 heures. et ça finit par revenir.

    J'ai tout d'abord pensé que c'était une surcharge du CPU, mais le cas est visible sur des machines sans activité spécifique.

    Le problème concèrne principalement Windows, machines actives / sans activités consommatrice, bref pas vraiment de règle.

    Le srv de PRD est en 3.2
    Le srv de REC est en 3.4
    les agents sur les serveurs sont en 3.4

    Je m'en remet à votre connaissance
  • SBO
    Zabbix Certified Specialist
    Zabbix Certified Specialist
    • Sep 2015
    • 226

    #2
    Salut,

    Pour commencer, même si je ne pense pas que ce soit la source du problème, tu n'es pas censé avoir une version de l'agent supérieure à la version de ton serveur Zabbix. Idéalement tu aurais dû mettre des agents 3.2.x

    Mais, encore une fois, je doute que ce soit la root cause de ta situation.

    Quand cela se produit, as-tu essayé d'interroger les agents qui ne répondent pas en ligne de commande ? As-tu passé les logs des agents en mode verbose afin de voir ce qui se passait ? As-tu remarqué des erreurs ?

    Bref, qu'as-tu comme informations jusqu'ici, purement zabbix vu que tout semble OK côté système ?

    Comment

    Working...