2. Распределение нагрузки и отказоустойчивость прокси

Обзор

Чтобы разрешить распределение нагрузки и отказоустойчивость, Zabbix прокси-серверы могут быть организованы в группы прокси.

Распределение нагрузки и отказоустойчивость прокси-серверов — это автоматическое перераспределение узлов сети между прокси-серверами в пределах группы прокси:

  • Если прокси выключается, его узлы сети будут перемещены на другие прокси, таким образом поддерживая отказоустойчивость прокси.
  • Если прокси-сервер имеет слишком высокое/низкое количество узлов сети по сравнению с другими прокси-серверами, его узлы сети будут перемещены на другие прокси-серверы, чтобы сбалансировать нагрузку на прокси.

Перераспределение узлов сети работает только между прокси-серверами в группе, которая удовлетворяет следующим условиям:

  • Прокси-серверы имеют версию 7.0 или новее.
  • Версия прокси-сервера соответствует версии Zabbix сервера. Если используется Zabbix агент (пассивный), то версия прокси должна соответствовать версии агента. Активные агенты требуют только версию Zabbix 7.0 или новее.
  • Группа прокси находится в состоянии online.
  • Узлы сети настроены на наблюдение через группу прокси, а не через отдельные прокси-серверы.

Работоспособность группы прокси может отслеживаться при помощи внутренних проверок любым узлом сети, назначенным на группу прокси. Однако, для отслеживания работоспособности отдельного прокси-сервера в группе, назначьте узел сети на этот прокси; в противном случае результаты могут быть нецелостными.

Перераспределение узлов сети

Распределение нагрузки и отказоустойчивость прокси управляются Zabbix сервером через процесс proxy group manager, который постоянно отслеживает состояние всех прокси-серверов в каждой группе прокси и распределение узлов сети на них.

Отказоустойчивость прокси в пределах группы обеспечивается через переключение прокси: при останове прокси его узлы сети немедленно перераспределяются на другие прокси. Также происхоит и распределение нагрузки, поскольку узлы сети переназначаются на прокси с наименьшим числом назначенных на них узлов сети.

Кроме того, распределение нагузки прокси активируется, когда количество узлов сети прокси-сервера отличается от среднего по группе как минимум на 10 узлов сети и в 2 раза (превышение либо недостаток узлов сети). Если дисбаланс сохраняется по истечении льготного периода (10 x задержка переключения), то группа прокси ставится в очередь на перераспределение узлов сети.

Процесс proxy group manager перераспределяет узлы сети, используя следующую логику:

  1. Вычислить среднее число узлов сети на прокси-сервер.
  2. Для прокси-серверов с превышением узлов сети — переместить превышающие узлы сети в пул неназначенных прокси-серверов.
  3. Для прокси-серверов с недостатком узлов сети — посчитать, сколько узлов сети нужно для достижения баланса.
  4. Убрать нужное число узлов сети от прокси-серверов с наибольшим количеством узлов сети.
  5. Переместить неназначенные узлы сети на прокси-серверы с наименьшим количеством узлов сети.

Примеры перераспределения узлов сети:

Узлов сети на прокси-сервере Среднее по группе Переназначение узлов сети
100 50 Да
60 50 Нет
40 50 Нет
25 50 Да
15 5 Да
10 5 Нет

Наличие менее чем 10 узлов сети, наблюдаемых через группу прокси, может привести к неравномерному распределению узлов сети между прокси-серверами в этой группе.

Настройка группы прокси

Для настройки группы прокси в веб-интерфейсе Zabbix:

  1. Перейдите к Администрирование → Группы прокси (Administration → Proxy groups)
  2. Нажмите Создать группу прокси (Create proxy group)

Параметр Описание
Имя (Name) Имя группы прокси-серверов.
Период аварийного переключения
(Failover period)
Период в секундах, в течение которого прокси-сервер в группе прокси должен связаться с сервером Zabbix, чтобы считаться онлайн (по умолчанию: 1m; диапазон: 10s-15m). Если прокси не связывается в течение этого периода, состояние прокси меняется на Офлайн (Offline), и его узлы сети немедленно перераспределяются по другим прокси. Распределение нагрузки прокси начинается по истечении этого 10-кратного периода.
Поддерживаются суффиксы времени (например, 30s, 1m) и пользовательские макросы.
Минимальное количество прокси
(Minimum number of proxies)
Наименьшее число онлайн прокси-серверов, требующихся для поддержания группы прокси онлайн (по умолчанию: 1; диапазон: 1-1000).
Поддерживаются пользовательские макросы.

Это значение должно быть меньше общего числа прокси-серверов в группе. Например, в группе из 10 прокси, настройка минимума в 10 приведёт к тому, что группа перейдёт в офлайн при сбое любого из прокси-серверов. Обратите внимание, что онлайн-прокси в офлайн-группе продолжают нормально работать, но балансировка нагрузки и отказоустойчивость функционировать не будут.
Описание (Description) Описание группы прокси.
Прокси (Proxies) При редактировании группы с прокси-серверами отображается список — до пяти прокси-серверов (в виде ссылок или обычного текста, в зависимости от прав пользователя на прокси-серверы).

Настройка балансировки нагрузки прокси

Чтобы использовать балансировку нагрузки прокси, необходимо настроить группу прокси в веб-интерфейсе Zabbix (см. выше) и убедиться, что узлы сети контролируются группой прокси, а не отдельными прокси (можно использовать массовое обновление узлов сети, чтобы перенести их с прокси в группу прокси).

Если используется Zabbix agent, также настройте его следующим образом:

  • Для пассивных проверок укажите все прокси группы прокси в параметре Server.
  • Для активных проверок рекомендуется указать все прокси группы прокси или Zabbix server в параметре ServerActive. Обратите внимание, что с группами прокси в активном режиме будет работать только Zabbix agent 7.0 (или более поздней версии).

Если параметр ServerActive включает только один прокси из группы прокси (или Zabbix server), агент все равно сможет подключиться к нужному прокси. Когда служба агента запускается и подключается к указанному прокси, агент получит и сохранит в кэше полный список IP-адресов прокси и их текущую нагрузку в группе. Затем активные проверки будут перенаправляться на правильный онлайн-прокси для узла сети на основе текущего назначения прокси-узел сети в группе прокси.

Указание только одного прокси в параметре ServerActive Zabbix agent может привести к потере данных мониторинга, если агент будет запущен или перезагружен, когда указанный прокси находится офлайн.

При использовании Zabbix sender запросы данных также перенаправляются на правильный онлайн-прокси для узла сети на основе текущего назначения прокси-узел сети в группе прокси. Однако если вы отправляете значения нескольких узлов сети из входного файла, используйте опцию -g, чтобы предотвратить отправку данных на неверный прокси.

Zabbix agent также должен иметь возможность подключаться ко всем прокси в группе прокси через межсетевой экран. В противном случае активные проверки могут зависать или завершаться сбоем во время перенаправления или отказоустойчивого переключения. Например:

  • Во время активных проверок прокси может перенаправить агента на другой прокси. Если этот прокси заблокирован межсетевым экраном, связь будет зависать в ожидании ответа.
  • В стабильных высокодоступных конфигурациях без недавней перебалансировки агенты могут никогда не обращаться к резервным прокси. Если правила межсетевого экрана были изменены и не проверялись, отказоустойчивое переключение может не сработать.
Тестирование балансировки нагрузки прокси

Чтобы протестировать балансировку нагрузки прокси:

  1. Настройте группу прокси.
  2. Убедитесь, что группа прокси находится в состоянии онлайн.
  3. Убедитесь, что узлы сети наблюдаются через группу прокси, а не отдельные прокси-серверы (для перемещения узлов сети от прокси-сервера к группе прокси можно использовать массовое обновление узлов сети).
  4. Подождите несколько секунд для обновления конфигурации и распределения узлов сети между прокси-серверами в группе прокси. Наблюдайте за изменениями, обновляя список узлов сети в Администрирование (Administration)Прокси (Proxies).
Важные замечания
  • SNMP трапы не поддерживаются прокси-серверами в группе прокси.
  • Проверки, зависящие от внешних настроек (например, скрипты для внешних проверок или настройки ODBC для проверок баз данных) должны иметь одинаковую конфигурацию на всех прокси-серверах в группе прокси.
  • Проверки баз данных требуют дополнительных разрешений на объектах/серверах баз данных.
  • Узлы сети VMware, наблюдаемые через группу прокси, будут случайным образом распределены между прокси-серверами в группе. Это приводит к тому, что каждый прокси кэширует все данные VMware, создавая в итоге дополнительную нагрузку на vCenter.
  • Узлы сети, созданные на основе данных авторегистрации от прокси-сервера в группе прокси, настраиваются на наблюдение через эту группу прокси. Однако, узлы сети, созданные на основе данных сетевого обнаружения от прокси-сервера в группе прокси, настраиваются на наблюдение через этот прокси-сервер.