9 Обслуживание

Обзор

В Zabbix можно определять периоды обслуживания для узлов сети и групп узлов сети.

Кроме того, можно определить обслуживание только для одного триггера (или подмножества триггеров), указав теги триггера. В этом случае обслуживание будет активировано только для этих триггеров; все остальные триггеры узла сети или группы узлов сети не будут находиться в обслуживании.

Существует два типа обслуживания — со сбором данных и без сбора данных.

Во время обслуживания «со сбором данных» триггеры обрабатываются как обычно, и при необходимости создаются события. Однако эскалации проблем для узлов сети/триггеров в обслуживании приостанавливаются, если в настройках действия установлен флажок Pause operations for suppressed problems. В этом случае шаги эскалации, которые могут включать отправку уведомлений или удалённые команды, будут игнорироваться на протяжении всего периода обслуживания. Обратите внимание, что операции восстановления и обновления проблем во время обслуживания не подавляются, подавляются только эскалации.

Например, если шаги эскалации запланированы на 0, 30 и 60 минут после начала проблемы, и имеется получасовое обслуживание, продолжающееся с 10-й по 40-ю минуту после возникновения реальной проблемы, то второй и третий шаги будут выполнены на полчаса позже, то есть на 60-й и 90-й минутах (если проблема всё ещё существует). Аналогично, если проблема возникает во время обслуживания, эскалация начнётся после окончания обслуживания.

Чтобы получать уведомления о проблемах во время обслуживания в обычном режиме (без задержки), необходимо снять флажок Pause operations for suppressed problems в настройках действия.

Если хотя бы один узел сети (используемый в выражении триггера) не находится в режиме обслуживания, Zabbix отправит уведомление о проблеме.

Сервер Zabbix должен быть запущен во время обслуживания. Периоды обслуживания пересчитываются каждую минуту или сразу после перезагрузки кэша конфигурации, если в период обслуживания были внесены изменения.

Процессы timer проверяют, нужно ли изменить статус узла сети на/с обслуживания, на 0-й секунде каждой минуты. Кроме того, каждую секунду процесс timer проверяет, нужно ли запускать/останавливать какие-либо обслуживания на основании изменений в [периодах обслуживания] после обновления конфигурации. Таким образом, скорость запуска/остановки периодов обслуживания зависит от интервала обновления конфигурации (по умолчанию 10 секунд). Обратите внимание, что изменения периода обслуживания не включают настройки Active since/Active till. Также, если узел сети/группа узлов сети добавляется в уже активный период обслуживания, изменения будут применены процессом timer только в начале следующей минуты.

Обратите внимание, что когда узел сети входит в обслуживание, процессы timer сервера Zabbix считывают все открытые проблемы, чтобы проверить, требуется ли их подавить. Это может повлиять на производительность, если имеется много открытых проблем. Сервер Zabbix также считывает все открытые проблемы при запуске, даже если на тот момент обслуживание не настроено.

Обратите внимание, что сервер Zabbix (или прокси) всегда собирает данные независимо от типа обслуживания (включая обслуживание «без данных»). Позже эти данные игнорируются сервером, если установлен режим «без сбора данных».

Когда обслуживание «без данных» заканчивается, триггеры, использующие функцию nodata(), не сработают до следующей проверки в пределах периода, который они проверяют.

Если элемент данных журнала добавлен, пока узел сети находится в обслуживании, и обслуживание заканчивается, будут собраны только новые записи журнала с момента окончания обслуживания.

Если для узла сети, находящегося в обслуживании типа «без данных», отправляется значение с временной меткой (например, с использованием Zabbix sender), это значение будет отброшено, однако можно отправить значение с временной меткой для уже истёкшего периода обслуживания, и оно будет принято.

Если пользователь изменяет период обслуживания, узлы сети, группы, или теги, изменения вступят в силу только после синхронизации кэша конфигурации.

Настройка

Чтобы настроить период обслуживания:

  1. Перейдите в: Сбор данных > Обслуживание.
  2. Нажмите Создать период обслуживания (или на имя существующего периода обслуживания).
  3. Введите параметры обслуживания в форме.

Все обязательные поля ввода отмечены красной звёздочкой.

Параметр Описание
Имя Имя периода обслуживания.
Тип обслуживания Можно задать два типа обслуживания:
Со сбором данных — данные будут собираться сервером во время обслуживания, триггеры будут обрабатываться;
Без сбора данных — данные не будут собираться сервером во время обслуживания.
См. Влияние периодов обслуживания, чтобы узнать, как каждый тип влияет на отчёт о доступности.
Активно с Дата и время, с которых выполнение периодов обслуживания становится активным.
Примечание: установка только этого времени не активирует период обслуживания; периоды обслуживания должны быть настроены в Периодах (см. ниже).
Активно до Дата и время, после которых выполнение периодов обслуживания перестаёт быть активным.
Периоды Этот блок позволяет определить точные дни и часы, когда выполняется обслуживание. Нажатие на открывает всплывающее окно с гибкой формой Период обслуживания, где можно определить расписание обслуживания. Подробное описание см. в разделе Периоды обслуживания.
Группы узлов сети Выберите группы узлов сети, для которых будет активировано обслуживание. Обслуживание будет активировано для всех узлов сети из указанных групп узлов сети. Это поле поддерживает автодополнение, поэтому при вводе в нём будет отображаться выпадающий список всех доступных групп узлов сети.
Указание родительской группы узлов сети неявно выбирает все вложенные группы узлов сети. Таким образом, обслуживание также будет активировано на узлах сети из вложенных групп.
Узлы сети Выберите узлы сети, для которых будет активировано обслуживание. Это поле поддерживает автодополнение, поэтому при вводе в нём будет отображаться выпадающий список всех доступных узлов сети.
Теги Укажите теги для подавления проблем с совпадающими тегами на узлах сети, находящихся на обслуживании.
Можно задать несколько условий. Сопоставление имён тегов всегда чувствительно к регистру.

Для каждого условия доступны два оператора:
Содержит — включить указанные имена тегов, где значения тегов содержат введённую строку (поиск подстроки, с учётом регистра);
Равно — включить указанные имена и значения тегов (с учётом регистра).

Для условий доступны два типа вычисления:
И/Или — должны быть выполнены все условия, условия с одинаковым именем тега будут сгруппированы по условию Или;
Или — достаточно выполнения одного условия.

Теги можно указывать только если выбран режим Со сбором данных.
Описание Описание периода обслуживания.
Периоды обслуживания

Окно периода обслуживания предназначено для планирования времени для повторяющегося или разового обслуживания. Форма является динамической, и доступные поля изменяются в зависимости от выбранного Типа периода.

Тип периода Описание
Только один раз Настройте разовый период обслуживания:
Дата — дата и время периода обслуживания;
Длительность периода обслуживания — как долго обслуживание будет активно.
Ежедневно Настройте ежедневный период обслуживания:
Каждые N дней — частота обслуживания (1 — (по умолчанию) каждый день, 2 — каждые два дня и т. д.);
В (час:минута) — время суток, когда начинается обслуживание;
Длительность периода обслуживания — как долго обслуживание будет активно.

Если параметр Каждые N дней больше "1", начальным днем считается день, на который приходится время Активно с. Примеры:
- если Активно с установлено в "2021-01-01 12:00", Каждые N дней установлено в "2", а В (час:минута) установлено в "23:00", тогда первый период обслуживания начнется 1 января в 23:00, а второй период обслуживания начнется 3 января в 23:00;
- если Активно с установлено в "2021-01-01 12:00", Каждые N дней установлено в "2", а В (час:минута) установлено в "01:00", тогда первый период обслуживания начнется 3 января в 01:00, а второй период обслуживания начнется 5 января в 01:00.
Еженедельно Настройте еженедельный период обслуживания:
Каждые N недель — частота обслуживания (1 — (по умолчанию) каждую неделю, 2 — каждые две недели и т. д.);
День недели — в какой день должно выполняться обслуживание;
В (час:минута) — время суток, когда начинается обслуживание;
Длительность периода обслуживания — как долго обслуживание будет активно.

Если параметр Каждые N недель больше "1", начальной неделей считается неделя, на которую приходится время Активно с. Примеры см. в описании параметра Ежедневно выше.
Ежемесячно Настройте ежемесячный период обслуживания:
Месяц — выберите все месяцы, в течение которых выполняется регулярное обслуживание;
Дата: День месяца — выберите этот вариант, если обслуживание должно выполняться в одну и ту же дату каждого месяца (например, в 1-й день каждого месяца), затем выберите нужный день в появившемся поле День месяца;
Дата: День недели — выберите этот вариант, если обслуживание должно выполняться только в определенные дни (например, каждый первый понедельник месяца), затем выберите (в выпадающем списке) нужную неделю месяца (первую, вторую, третью, четвертую или последнюю), а затем отметьте флажки для дня(дней) обслуживания;
В (час:минута) — время суток, когда начинается обслуживание;
Длительность периода обслуживания — как долго обслуживание будет активно.

При создании периода обслуживания используется часовой пояс пользователя, который его создает. Однако при планировании повторяющихся периодов обслуживания (Ежедневно, Еженедельно, Ежемесячно) используется часовой пояс сервера Zabbix. Чтобы обеспечить предсказуемое поведение повторяющихся периодов обслуживания, необходимо использовать общий часовой пояс для всех компонентов Zabbix.

Когда закончите, нажмите Добавить, чтобы добавить период обслуживания в блок Периоды.

Обратите внимание, что переходы на летнее/зимнее время (DST) не влияют на длительность обслуживания. Например, предположим, что у нас настроено двухчасовое обслуживание, которое обычно начинается в 01:00 и заканчивается в 03:00:

  • если после одного часа обслуживания (в 02:00) происходит переход на летнее/зимнее время и текущее время изменяется с 02:00 на 03:00, обслуживание продолжится ещё один час (до 04:00);
  • если после двух часов обслуживания (в 03:00) происходит переход на летнее/зимнее время и текущее время изменяется с 03:00 на 02:00, обслуживание остановится, поскольку прошло два часа;
  • если период обслуживания начинается в течение часа, который пропускается при переходе на летнее/зимнее время, то обслуживание не начнётся.

Если период обслуживания задан как "1 день" (фактическая длительность обслуживания составляет 24 часа, поскольку Zabbix рассчитывает дни в часах), начинается в 00:00 и заканчивается в 00:00 следующего дня:

  • обслуживание остановится в 01:00 следующего дня, если текущее время переводится на один час вперёд;
  • обслуживание остановится в 23:00 этого дня, если текущее время переводится на один час назад.

Просмотр

Отображение узлов сети в обслуживании

Оранжевый значок гаечного ключа рядом с именем узла сети указывает, что этот узел сети находится в обслуживании в следующих разделах:

  • Панели
  • Мониторинг > Проблемы
  • Инвентаризация > Узлы сети > Сведения об инвентаризации узла сети
  • Сбор данных > Узлы сети (см. столбец «Состояние»)

Сведения об обслуживании отображаются при наведении указателя мыши на значок.

Кроме того, узлы сети, находящиеся в обслуживании, выделяются оранжевым фоном в разделе Мониторинг > Карты.

Отображение подавленных проблем

Обычно проблемы для узлов сети, находящихся на обслуживании, подавляются, то есть не отображаются в веб-интерфейсе. Однако также можно настроить отображение подавленных проблем, выбрав опцию Показывать подавленные проблемы в следующих местах:

  • Панели (в настройках виджетов Узлы сети с проблемами, Проблемы, Проблемы по важности, Обзор триггеров)
  • Мониторинг > Проблемы (в фильтре)
  • Мониторинг > Карты (в настройках карты)
  • Глобальные уведомления (в настройках профиля пользователя)

Когда отображаются подавленные проблемы, показывается следующий значок: . При наведении указателя мыши на значок отображаются дополнительные сведения.

Расчет очередей во время обслуживания

Очереди, отображаемые в веб-интерфейсе Zabbix (Administration > Queue), рассчитываются сервером Zabbix. Они не включают элементы данных, находящиеся на обслуживании без сбора данных — длина очереди для таких элементов данных всегда равна нулю, даже если получение их значений задерживается. Задержанные элементы данных на обслуживании со сбором данных по-прежнему учитываются в очереди.

Zabbix прокси не знает о периодах обслуживания, поскольку между сервером Zabbix и прокси не выполняется синхронизация конфигурации обслуживания. Внутренние проверки, рассчитываемые на прокси Zabbix (например, zabbix[queue,,] и zabbix[stats,,,queue,,]), сообщают о задержанных элементах данных независимо от статуса обслуживания на сервере Zabbix.

В результате веб-интерфейс Zabbix и внутренние проверки на прокси Zabbix могут сообщать разную длину очереди для одних и тех же элементов данных, находящихся на обслуживании без сбора данных.