3. Пример настройки

Обзор

В этом разделе описана простая настройка мониторинга кластера высокой доступности Zabbix как услуги.

Предварительные требования

Перед тем как настраивать мониторинг услуг, вам необходимо настроить следующие узлы сети:

  • HA нода 1 с по крайней мере одним триггером и тегом (желательно задать на уровне триггера) component:ha-node-1
  • HA нода 2 с по крайней мере одним триггером и тегом (желательно задать на уровне триггера) component:ha-node-2

Дерево сервисов

Следующий шаг — построить дерево сервисов. В этом примере инфраструктура очень простая и состоит из трех сервисов: Zabbix cluster (родительский) и двух дочерних сервисов Zabbix server node 1 и Zabbix server node 2.

Zabbix cluster
|
|- Zabbix server node 1
|- Zabbix server node 2

На странице Services включите режим Edit и нажмите Create service:

В окне настройки сервиса введите имя Zabbix cluster и нажмите заголовок Advanced configuration, чтобы отобразить дополнительные параметры настройки.

Настройте дополнительное правило:

У Zabbix cluster будет два дочерних сервиса — по одному для каждого из узлов HA. Если у обоих узлов HA возникнут проблемы со статусом не ниже Warning, статус родительского сервиса должен быть установлен в Disaster. Чтобы этого добиться, дополнительное правило следует настроить так:

  • Set status to: Disaster
  • Condition: If at least N child services have Status status or above
  • N: 2
  • Status: Warning

Перейдите на вкладку Tags и добавьте тег application:zabbix-server. Этот тег будет использоваться позже для действий с сервисами и отчетов SLA.

Сохраните новый сервис.

Чтобы добавить дочернюю услугу, нажмите значок плюса рядом с услугой кластера Zabbix (значок виден только в режиме Edit).

В окне настройки услуги введите имя Zabbix server node 1. Обратите внимание, что параметр Parent services уже предварительно заполнен значением Zabbix cluster.

Доступность этой услуги зависит от проблем на узле сети HA node 1, отмеченных тегом проблемы component:ha-node-1. В параметре Problem tags введите:

  • Name: component
  • Operation: Equals
  • Value: ha-node-1

Перейдите на вкладку Tags и добавьте тег услуги: zabbix-server:node-1. Этот тег будет использоваться позже для действий с услугами и отчетов SLA.

Сохраните новую услугу.

Создайте еще одну дочернюю для Zabbix кластера услугу с именем «Zabbix сервер нода 2».

Задайте теги проблем следующим образом:

  • Имя: component
  • Операция: Равно
  • Значение: ha-node-2

Переключитесь на вкладку Теги и добавьте тег услуги: zabbix-server:node-2.

Сохраните новую услугу.

SLA

В этом примере ожидаемая производительность кластера Zabbix составляет 100% без учета полугодового периода обслуживания длительностью один час.

Сначала необходимо добавить новое соглашение об уровне сервиса.

Перейдите в раздел меню Services->SLA и нажмите Create SLA. Введите имя Zabbix cluster performance и установите SLO на 100%.

Сервис Zabbix cluster имеет тег сервиса application:zabbix-server. Чтобы использовать это SLA для измерения производительности кластера Zabbix, в параметре Service tags укажите:

  • Name: application
  • Operation: Equals
  • Value: zabbix-server

В реальной среде также можно изменить желаемый отчетный период, часовой пояс и дату начала либо изменить расписание с 24/7 на пользовательское. В этом примере настроек по умолчанию достаточно.

Перейдите на вкладку Excluded downtimes и добавьте периоды простоя для запланированного обслуживания, чтобы исключить эти периоды из расчета SLA. В разделе Excluded downtimes нажмите ссылку Add, введите имя простоя, запланированное время начала и длительность.

Нажмите Add, чтобы сохранить новое SLA.

Перейдите в раздел отчетов SLA, чтобы просмотреть отчет SLA для кластера Zabbix.

Информацию о SLA также можно проверить в разделе Services.