Bonjour,
Nous utilisons Zabbix server (version 2.2.11) pour monitorer des machines clientes.
Nous nous sommes rendus compte récemment que certaines machines clientes étaient plantées, et renvoyaient l'erreur suivante dans l'interface :
Get value from agent failed: cannot connect to [[192.168.0.1]:10050]: [4] Interrupted system cal
De base, nous utilisons certains triggers pour vérifier si un serveur est opérationnel ou non, comme par exemple :
{monserveur:icmppingloss[,10,200,,500].min(300)}>98
Et
{monserveur:agent.ping.nodata(600)}
Les deux triggers sont configurés en "High", et un email et un SMS sont envoyés.
Cependant, lorsque le problème se produit, la sonde icmppingloss fonctionne, mais les autres triggers renvoient la même erreur Get value from agent failed: cannot connect to [[192.168.0.1]:10050]: [4] Interrupted system cal.
Nous ne recevons aucune alerte de ce problème, le serveur n'est plus surveillé, ce qui nous pose problème.
Ma question est donc de savoir comment je peux déclencher une alerte lorsqu'un agent renvoie l'erreur "Get value from agent failed: cannot connect to [[192.168.0.1]:10050]: [4] Interrupted system cal" ?
D'avance merci
Nous utilisons Zabbix server (version 2.2.11) pour monitorer des machines clientes.
Nous nous sommes rendus compte récemment que certaines machines clientes étaient plantées, et renvoyaient l'erreur suivante dans l'interface :
Get value from agent failed: cannot connect to [[192.168.0.1]:10050]: [4] Interrupted system cal
De base, nous utilisons certains triggers pour vérifier si un serveur est opérationnel ou non, comme par exemple :
{monserveur:icmppingloss[,10,200,,500].min(300)}>98
Et
{monserveur:agent.ping.nodata(600)}
Les deux triggers sont configurés en "High", et un email et un SMS sont envoyés.
Cependant, lorsque le problème se produit, la sonde icmppingloss fonctionne, mais les autres triggers renvoient la même erreur Get value from agent failed: cannot connect to [[192.168.0.1]:10050]: [4] Interrupted system cal.
Nous ne recevons aucune alerte de ce problème, le serveur n'est plus surveillé, ce qui nous pose problème.
Ma question est donc de savoir comment je peux déclencher une alerte lorsqu'un agent renvoie l'erreur "Get value from agent failed: cannot connect to [[192.168.0.1]:10050]: [4] Interrupted system cal" ?
D'avance merci