Добрый день !
Может кто подскажет, моей логики не хватает :<(
Опишу, что хочу, сначала без Zabbix, мне кажется так будет понятнее.
На клентской Linux-машине с Zabbix-агентом периодически запускается и заканчивается (если все нормально) процесс. С консоли, для контроля я даю ps -ef|grep ftam и вижу или он/они работают (процессов может быть несколько), через одну-пять минут опять запускаю и смотрю или они работают с новым ID и новым временем старта или они в данный момент не запущены (это тоже нормально, ничего не передается). Но вот я вижу, что у одного/нескольких процесса/ов ID и время старта не меняется. Это ошибка, один или несколько процессов ftam "зависли".
Теперь к Zabbix-у. Настраиваю событие proc.num[ftam], получаю колличество запущенных процессов 0,1,3,7 и т.д. Но я получаю именно их общее число, без ID или времени старта.
Вопрос: как настроить логику триггера (или нескольких по цепочке), чтобы отследить описанную проблему. В мою голову приходит только за период "T" значение ftam > 0, но это же приведет к куче ложных срабатываний, т.к., например 2-процесса зависло, а 3 отлично работают.
Буду ооооочень сильно благодарен за совет :>))
Может кто подскажет, моей логики не хватает :<(
Опишу, что хочу, сначала без Zabbix, мне кажется так будет понятнее.
На клентской Linux-машине с Zabbix-агентом периодически запускается и заканчивается (если все нормально) процесс. С консоли, для контроля я даю ps -ef|grep ftam и вижу или он/они работают (процессов может быть несколько), через одну-пять минут опять запускаю и смотрю или они работают с новым ID и новым временем старта или они в данный момент не запущены (это тоже нормально, ничего не передается). Но вот я вижу, что у одного/нескольких процесса/ов ID и время старта не меняется. Это ошибка, один или несколько процессов ftam "зависли".
Теперь к Zabbix-у. Настраиваю событие proc.num[ftam], получаю колличество запущенных процессов 0,1,3,7 и т.д. Но я получаю именно их общее число, без ID или времени старта.
Вопрос: как настроить логику триггера (или нескольких по цепочке), чтобы отследить описанную проблему. В мою голову приходит только за период "T" значение ftam > 0, но это же приведет к куче ложных срабатываний, т.к., например 2-процесса зависло, а 3 отлично работают.
Буду ооооочень сильно благодарен за совет :>))
Comment