3 Эскалации

Обзор

С эскалации вы можете создавать пользовательские сценарии для отправки оповещений или для выполнения удаленных команд.

На практике это означает, что:

  • Пользователи могут быть информированы о новых проблемах немедленно
  • Оповещения могут быть повторены до решения проблемы
  • Отправка оповещения может быть с задержкой
  • Оповещения могут эскалироваться другой "более высокой" группе пользователей
  • Удаленные команды могут быть выполнены незамедлительно или когда проблема не решена за длительный период времени
  • Могут быть отправлены сообщения о восстановлении

Действия эскалируются на основании шага эскалации. Каждый шаг имеет продолжительность по времени.

Вы можете задать и продолжительность по умолчанию, и пользовательскую продолжительность для каждого отдельного шага. Минимальная продолжительность одного шага эскалации 60 секунд.

Вы можете начать действия, такие как отправка оповещения или выполнение команд, с любого шага. Шаг первый для немедленных действий. Если вы захотите отложить действие, вы можете назначить его на следующий шаг. Для каждого шага могут быть назначены несколько действий.

Количество шагов эскалаций не ограниченно.

Эскалации задаются при настройке действия.

Если разные эскалации идут в непосредственной последовательности и перекрываются, выполнение каждой новой эскалации заменяет предыдущую эскалацию, но по крайней мере одним шагом эскалации, который всегда выполняется при предыдущей эскалации. Такое поведение имеет отношение к действиям на события, которые создаются при КАЖДОМ вычислении проблемы для триггера.

Примеры эскалаций

Пример 1

Отправка повторяющихся оповещений каждые 30 минут (в общей сложности 5 раз) группе 'MySQL администраторы'. Для настройки:

  • Задайте Период эскалации по умолчанию равным '1800' секундам (30 минут) в общих атрибутах действия
  • на вкладке Операции, установите шаги эскалаций С '1' До '5'
  • Выберите группу 'MySQL администраторы' получателями сообщения

Оповещения будут отправлены в 0:00, 0:30, 1:00, 1:30, 2:00 часов после начала проблемы (если, конечно, проблема не будет решена раньше).

Если проблема решена и сообщение о восстановление настроено, оно будет отправлено всем тем, кто получил хотя бы одно сообщение в этом сценарии эскалаций.

Если триггер, который вызвал активную эскалацию был деактивирован, Zabbix отправит информационное сообщение об этом всем тем, кто уже получил оповещения.

Пример 2

Отправка оповещения с задержкой о давней проблеме. Для настройки:

  • Задайте Период эскалации по умолчанию равным '36000' секунд (10 часов) в общих атрибутах действия
  • На вкладке Операции, установите шаги эскалации С '2' До '2'

Оповещение будет отправлено только к Шагу 2 сценария эскалации, или через 10 часов после начала проблемы.

Вы можете изменить текст сообщения на что-то вроде 'Проблема не решена более чем 10 часов'.

Пример 3

Эскалирование проблемы Руководству.

В первом примере мы настраивали периодическую отправку сообщений Администраторам MySQL. В этом случае, администраторы будут получать четыре сообщения до того, как проблема будет эскалирована Менеджеру баз данных. Обратите внимание, что менеджер получит сообщение только в случае если проблема еще не подтверждена, предположительно, никто не работает над ней.

Обратите внимание на использование макроса {ESC.HISTORY} в сообщении. Этот макрос будет содержать информацию обо всех ранее выполненных шагах этой эскалации, таких как отправка оповещений и выполнение команд.

Пример 4

Более сложный сценарий. После нескольких сообщений Администраторам MySQL и эскалации менеджеру, Zabbix попытается перезапустить базу данных MySQL. Это произойдет, если проблема остается через 2:30 часов и еще не была подтверждена.

Если проблема все еще существует, спустя еще 30 минут Zabbix отправит сообщение всем пользователям в Японии.

Если это не поможет, спустя еще час Zabbix перезагрузит сервер с этой базой данных MySQL (вторая удаленная команда) используя IPMI команды.

Пример 5

Эскалация с несколькими операциями назначенными одному шагу и с использованием пользовательских интервалов. Период эскалации по умолчанию равен 30 минутам.

Оповещения будут отправлены в следующем порядке:

  • MySQL администраторам в 0:00, 0:30, 1:00, 1:30 после начала проблемы
  • Zabbix администраторам в 2:00, 2:10, 2:20, 2:30 после начала проблемы (установлена пользовательская длительность шага равная 600 секундам)
  • Менеджеру баз данных в 2:00 и 2:10 (более короткая пользовательская длительность менее 600 секунд заменяет здесь длительную пользовательскую продолжительность равную 3600 секундам)
  • Гостевые пользователи в 4:00 часа после начала проблемы (интервал по умолчанию равный 30 минутам возвращается между шагами 8 и 11)