Доброе время суток!
В последнее время стали замечать, что не всегда срабатывает действие, которое должно запускать скрипт в случае аварии.
Действие настроено следующим образом:
Условия:
(A) и (B) и (C) и (D) и (E или F или G или H или I)
(A) Состояние обслуживания не в "обслуживание"
(B) Значение триггера = "ПРОБЛЕМА"
(C) Важность триггера = "Чрезвычайная"
(D) Имя триггера содержит "Доступность"
(E) Группа узлов сети = "PON"
(F) Группа узлов сети = "VoIP"
(G) Группа узлов сети = "Router"
(H) Группа узлов сети = "DSL"
(I) Группа узлов сети = "Switch"
Операции:
Выполнить удаленные команды на узлах сети: FreeBSD8.2-zbx_server
Шаг
От 1
К 1
Длительность шага 0 (по умолчанию 3600)
Тип операции "удаленная команда"
Узел сети: FreeBSD8.2-zbx_server (на котором zabbix-server)
Тип: пользовательский скрипт
Выполнять на: Zabbix сервер
Команды: <команда с запуском скрипта>
(передаются следующие макросы: '{HOST.HOST}' '{TRIGGER.ID}' '{EVENT.ID}')
Проблема заключается в том, что это действие иногда срабатывает, а иногда нет (причем, не оставляя никаких следов в аудит логе). Я даже пробовал, чтобы проверить, попадает ли событие под условие, еще раз смоделировать аварию, по которой действие не сработало. Во второй раз оно сработало и команда выполнилась, хотя я менял только IP адрес хоста, чтобы он не пинговался.
Может быть можно настроить более подробно логгирование? Никаких намеков на действия в логах как агента так и сервера я не нашел, в аудите действие просто отсутствует (как будто по условиям не подошло). Помогите, пожалуйста, разобраться с проблемой.
В последнее время стали замечать, что не всегда срабатывает действие, которое должно запускать скрипт в случае аварии.
Действие настроено следующим образом:
Условия:
(A) и (B) и (C) и (D) и (E или F или G или H или I)
(A) Состояние обслуживания не в "обслуживание"
(B) Значение триггера = "ПРОБЛЕМА"
(C) Важность триггера = "Чрезвычайная"
(D) Имя триггера содержит "Доступность"
(E) Группа узлов сети = "PON"
(F) Группа узлов сети = "VoIP"
(G) Группа узлов сети = "Router"
(H) Группа узлов сети = "DSL"
(I) Группа узлов сети = "Switch"
Операции:
Выполнить удаленные команды на узлах сети: FreeBSD8.2-zbx_server
Шаг
От 1
К 1
Длительность шага 0 (по умолчанию 3600)
Тип операции "удаленная команда"
Узел сети: FreeBSD8.2-zbx_server (на котором zabbix-server)
Тип: пользовательский скрипт
Выполнять на: Zabbix сервер
Команды: <команда с запуском скрипта>
(передаются следующие макросы: '{HOST.HOST}' '{TRIGGER.ID}' '{EVENT.ID}')
Проблема заключается в том, что это действие иногда срабатывает, а иногда нет (причем, не оставляя никаких следов в аудит логе). Я даже пробовал, чтобы проверить, попадает ли событие под условие, еще раз смоделировать аварию, по которой действие не сработало. Во второй раз оно сработало и команда выполнилась, хотя я менял только IP адрес хоста, чтобы он не пинговался.
Может быть можно настроить более подробно логгирование? Никаких намеков на действия в логах как агента так и сервера я не нашел, в аудите действие просто отсутствует (как будто по условиям не подошло). Помогите, пожалуйста, разобраться с проблемой.
Comment