9 Обслуживание

Обзор

Техническое обслуживание используется для подавления проблем в заранее определенные периоды времени.

В Zabbix можно задавать периоды технического обслуживания для узлов сети и групп узлов сети.

Кроме того, можно определить техническое обслуживание только для одного триггера (или подмножества триггеров), указав теги триггера. В этом случае техническое обслуживание будет активировано только для этих триггеров; все остальные триггеры узла сети или группы узлов сети не будут находиться в техническом обслуживании.

Существует два типа технического обслуживания: Сбор данных и Без сбора данных.

Во время технического обслуживания типа Сбор данных триггеры обрабатываются как обычно, и при необходимости создаются события. Однако если в конфигурации действия отмечена опция Приостановить операции для подавленных проблем, эскалации проблем для узлов сети/триггеров, находящихся в техническом обслуживании, будут приостановлены. В этом случае шаги эскалации, которые могут включать отправку уведомлений или удаленных команд, будут игнорироваться в течение всего периода технического обслуживания. Обратите внимание, что операции восстановления и обновления не подавляются во время технического обслуживания, подавляются только эскалации. Уведомления о восстановлении не отправляются, если проблема началась во время технического обслуживания.

Например, если шаги эскалации запланированы через 0, 30 и 60 минут после возникновения проблемы, а выполняется получасовое техническое обслуживание с 10-й по 40-ю минуту после фактического возникновения проблемы, то второй и третий шаги будут выполнены на полчаса позже, то есть через 60 и 90 минут (при условии, что проблема все еще существует). Аналогично, если проблема возникает во время технического обслуживания, эскалация начнется после завершения технического обслуживания.

Чтобы получать уведомления о проблемах во время технического обслуживания без задержки, необходимо снять флажок Приостановить операции для подавленных проблем в конфигурации действия.

Если хотя бы один узел сети (используемый в выражении триггера) не находится в режиме технического обслуживания, Zabbix отправит уведомление о проблеме.

Сервер Zabbix должен быть запущен во время технического обслуживания. Техническое обслуживание пересчитывается каждую минуту или сразу после перезагрузки кэша конфигурации, если в периоде технического обслуживания произошли изменения.

Процессы таймера проверяют, нужно ли изменить статус узла сети на/из режима технического обслуживания, в 0 секунд каждой минуты. Кроме того, каждую секунду процесс таймера проверяет, нужно ли запускать/останавливать какое-либо техническое обслуживание на основе изменений в [периодах технического обслуживания] после обновления конфигурации. Таким образом, скорость запуска/остановки периодов технического обслуживания зависит от интервала обновления конфигурации (по умолчанию 10 секунд). Обратите внимание, что изменения периода технического обслуживания не включают настройки Активно с/Активно до. Также если узел сети/группа узлов сети добавляется в уже существующий активный период технического обслуживания, изменения будут активированы процессом таймера только в начале следующей минуты.

Обратите внимание, что когда узел сети переходит в режим технического обслуживания, процессы таймера сервера Zabbix будут считывать все открытые проблемы, чтобы проверить, нужно ли их подавлять. Это может повлиять на производительность, если открытых проблем много. Сервер Zabbix также будет считывать все открытые проблемы при запуске, даже если на тот момент не настроено ни одного технического обслуживания.

Обратите внимание, что сервер Zabbix (или прокси) всегда собирает данные независимо от типа технического обслуживания (включая техническое обслуживание Без сбора данных). Позже сервер игнорирует эти данные, если задано Без сбора данных.

Когда заканчивается техническое обслуживание типа Без сбора данных, триггеры, использующие функцию nodata(), не сработают до следующей проверки в течение периода, который они проверяют.

Если элемент данных журнала добавляется, когда узел сети находится в техническом обслуживании, а затем техническое обслуживание заканчивается, будут собраны только новые записи файла журнала, появившиеся после окончания технического обслуживания.

Если для узла сети, находящегося в техническом обслуживании типа Без сбора данных, отправляется значение с отметкой времени (например, с помощью Zabbix sender), то это значение будет отброшено; однако можно отправить значение с отметкой времени для истекшего периода технического обслуживания, и оно будет принято.

Если период технического обслуживания, узлы сети, группы или теги изменяются пользователем, изменения вступят в силу только после синхронизации кэша конфигурации.

Конфигурация

Чтобы настроить период обслуживания:

  1. Перейдите в: Сбор данных > Обслуживание.
  2. Нажмите Создать период обслуживания (или на имя существующего периода обслуживания).
  3. Введите параметры обслуживания в форме.

Все обязательные поля ввода отмечены красной звездочкой.

Parameter Description
Name Имя периода обслуживания.
Maintenance type Можно задать два типа обслуживания:
Сбор данных - данные собираются сервером во время обслуживания, и триггеры обрабатываются;
Без сбора данных - данные по-прежнему могут собираться, но во время обслуживания они не сохраняются в базу данных, и триггеры (включая функцию nodata()) не срабатывают.
См. Влияние периодов обслуживания, чтобы узнать, как каждый тип влияет на отчет о доступности.
Active since Дата и время, с которых выполнение периодов обслуживания становится активным.
Примечание: Указание только этого времени не активирует период обслуживания; периоды обслуживания должны быть настроены в Periods (см. ниже).
Active till Дата и время, до которых выполнение периодов обслуживания остается активным.
Periods Этот блок позволяет задать точные дни и часы, когда выполняется обслуживание. Нажатие открывает всплывающее окно с гибкой формой Период обслуживания, где можно задать расписание обслуживания. Подробное описание см. в разделе Периоды обслуживания.
Host groups Выберите группы узлов сети, для которых будет активировано обслуживание. Обслуживание будет активировано для всех узлов сети из указанных групп узлов сети. Это поле поддерживает автодополнение, поэтому при вводе в нем будет отображаться выпадающий список всех доступных групп узлов сети.
Указание родительской группы узлов сети неявно выбирает все вложенные группы узлов сети. Таким образом, обслуживание также будет активировано на узлах сети из вложенных групп.
Hosts Выберите узлы сети, для которых будет активировано обслуживание. Это поле поддерживает автодополнение, поэтому при вводе в нем будет отображаться выпадающий список всех доступных узлов сети.
Tags Укажите теги для подавления проблем с совпадающими тегами на узлах сети в обслуживании.
Можно задать несколько условий. Сопоставление имени тега всегда чувствительно к регистру.

Для каждого условия доступны два оператора:
Contains - включать указанные имена тегов, если значения тегов содержат введенную строку (поиск подстроки, чувствителен к регистру);
Equals - включать указанные имена и значения тегов (чувствительно к регистру).

Для условий доступны два типа вычисления:
And/Or - должны быть выполнены все условия, при этом условия с одинаковым именем тега будут сгруппированы по условию Or;
Or - достаточно выполнения одного условия.

Теги можно указать только если выбран тип обслуживания Сбор данных.
Description Описание периода обслуживания.
Периоды обслуживания

Окно периода обслуживания предназначено для планирования времени для повторяющегося или разового обслуживания. Форма является динамической, и доступные поля изменяются в зависимости от выбранного Типа периода.

Тип периода Описание
Только один раз Настройте разовый период обслуживания:
Дата — дата и время периода обслуживания;
Длительность периода обслуживания — как долго обслуживание будет активно.
Ежедневно Настройте ежедневный период обслуживания:
Каждые N дней — частота обслуживания (1 — (по умолчанию) каждый день, 2 — каждые два дня и т. д.);
В (час:минута) — время суток, когда начинается обслуживание;
Длительность периода обслуживания — как долго обслуживание будет активно.

Если параметр Каждые N дней больше "1", начальным днем считается день, на который приходится время Активно с. Примеры:
- если Активно с установлено в "2021-01-01 12:00", Каждые N дней установлено в "2", а В (час:минута) установлено в "23:00", тогда первый период обслуживания начнется 1 января в 23:00, а второй период обслуживания начнется 3 января в 23:00;
- если Активно с установлено в "2021-01-01 12:00", Каждые N дней установлено в "2", а В (час:минута) установлено в "01:00", тогда первый период обслуживания начнется 3 января в 01:00, а второй период обслуживания начнется 5 января в 01:00.
Еженедельно Настройте еженедельный период обслуживания:
Каждые N недель — частота обслуживания (1 — (по умолчанию) каждую неделю, 2 — каждые две недели и т. д.);
День недели — в какой день должно выполняться обслуживание;
В (час:минута) — время суток, когда начинается обслуживание;
Длительность периода обслуживания — как долго обслуживание будет активно.

Если параметр Каждые N недель больше "1", начальной неделей считается неделя, на которую приходится время Активно с. Примеры см. в описании параметра Ежедневно выше.
Ежемесячно Настройте ежемесячный период обслуживания:
Месяц — выберите все месяцы, в течение которых выполняется регулярное обслуживание;
Дата: День месяца — выберите этот вариант, если обслуживание должно выполняться в одну и ту же дату каждого месяца (например, в 1-й день каждого месяца), затем выберите нужный день в появившемся поле День месяца;
Дата: День недели — выберите этот вариант, если обслуживание должно выполняться только в определенные дни (например, каждый первый понедельник месяца), затем выберите (в выпадающем списке) нужную неделю месяца (первую, вторую, третью, четвертую или последнюю), а затем отметьте флажки для дня(дней) обслуживания;
В (час:минута) — время суток, когда начинается обслуживание;
Длительность периода обслуживания — как долго обслуживание будет активно.

При создании периода обслуживания используется часовой пояс пользователя, который его создает. Однако при планировании повторяющихся периодов обслуживания (Ежедневно, Еженедельно, Ежемесячно) используется часовой пояс сервера Zabbix. Чтобы обеспечить предсказуемое поведение повторяющихся периодов обслуживания, необходимо использовать общий часовой пояс для всех компонентов Zabbix.

Когда закончите, нажмите Add, чтобы добавить период обслуживания в блок Periods.

Обратите внимание, что изменения времени при переходе на летнее/зимнее время (DST) не влияют на длительность обслуживания. Например, предположим, что настроено двухчасовое обслуживание, которое обычно начинается в 01:00 и заканчивается в 03:00:

  • если после одного часа обслуживания (в 02:00) происходит переход на летнее/зимнее время и текущее время меняется с 02:00 на 03:00, обслуживание продолжится еще один час (до 04:00);
  • если после двух часов обслуживания (в 03:00) происходит переход на летнее/зимнее время и текущее время меняется с 03:00 на 02:00, обслуживание завершится, поскольку прошло два часа;
  • если период обслуживания начинается в час, который пропускается из-за перехода на летнее/зимнее время, то обслуживание не начнется.

Если период обслуживания задан как "1 day" (фактическая длительность обслуживания составляет 24 часа, поскольку Zabbix рассчитывает дни в часах), начинается в 00:00 и заканчивается в 00:00 следующего дня:

  • обслуживание завершится в 01:00 следующего дня, если текущее время сдвинется вперед на один час;
  • обслуживание завершится в 23:00 этого дня, если текущее время сдвинется назад на один час.

Просмотр

Отображение узлов сети в обслуживании

Оранжевый значок гаечного ключа рядом с именем узла сети указывает, что этот узел сети находится в обслуживании в следующих разделах:

  • Панели
  • Мониторинг > Проблемы
  • Инвентаризация > Узлы сети > Сведения об инвентаризации узла сети
  • Сбор данных > Узлы сети (см. столбец «Состояние»)

Сведения об обслуживании отображаются при наведении указателя мыши на значок.

Кроме того, узлы сети, находящиеся в обслуживании, выделяются оранжевым фоном в разделе Мониторинг > Карты.

Отображение подавленных проблем

Обычно проблемы для узлов сети в обслуживании подавляются, то есть не отображаются во веб-интерфейсе. Однако можно настроить отображение подавленных проблем, выбрав параметр Показывать подавленные проблемы в следующих местах:

  • Панели (в конфигурации виджетов Проблемные узлы сети, Проблемы, Проблемы по степени важности, Обзор триггеров)
  • Мониторинг > Проблемы (в фильтре)
  • Мониторинг > Карты (в конфигурации карты)
  • Глобальные уведомления (в конфигурации профиля пользователя)

Когда отображаются подавленные проблемы, показывается следующий значок: . При наведении указателя мыши на значок отображается дополнительная информация.

Расчёт очередей во время обслуживания

Очереди, отображаемые в веб-интерфейсе Zabbix (Administration > Queue), рассчитываются сервером Zabbix. Они не включают элементы данных в обслуживании Без сбора данных, и длина очереди для этих элементов данных всегда равна нулю, даже если получение их значений задерживается. Задержанные элементы данных в обслуживании Со сбором данных по-прежнему учитываются в очереди.

Zabbix прокси не знает о периодах обслуживания, поскольку между сервером Zabbix и прокси отсутствует синхронизация конфигурации обслуживания. Внутренние проверки, рассчитываемые на прокси Zabbix (например, zabbix[queue,,] и zabbix[stats,,,queue,,]), сообщают о задержанных элементах данных независимо от статуса обслуживания на сервере Zabbix.

В результате веб-интерфейс Zabbix и внутренние проверки на прокси Zabbix могут сообщать разную длину очереди для одних и тех же элементов данных в обслуживании Без сбора данных.