2. Распределение нагрузки и отказоустойчивость прокси
Обзор
Чтобы разрешить распределение нагрузки и отказоустойчивость, Zabbix прокси-серверы могут быть организованы в группы прокси.
Распределение нагрузки и отказоустойчивость прокси-серверов — это автоматическое перераспределение узлов сети между прокси-серверами в пределах группы прокси:
- Если прокси выключается, его узлы сети будут перемещены на другие прокси, таким образом поддерживая отказоустойчивость прокси.
- Если прокси-сервер имеет слишком высокое/низкое количество узлов сети по сравнению с другими прокси-серверами, его узлы сети будут перемещены на другие прокси-серверы, чтобы сбалансировать нагрузку на прокси.
Перераспределение узлов сети работает только между прокси-серверами в группе, которая удовлетворяет следующим условиям:
- Прокси-серверы имеют версию 7.0 или новее.
- Версия прокси-сервера соответствует версии Zabbix сервера. Если используется Zabbix агент (пассивный), то версия прокси должна соответствовать версии агента. Активные агенты требуют только версию Zabbix 7.0 или новее.
- Группа прокси находится в состоянии online.
- Узлы сети настроены на наблюдение через группу прокси, а не через отдельные прокси-серверы.
Работоспособность группы прокси может отслеживаться при помощи внутренних проверок любым узлом сети, назначенным на группу прокси. Однако, для отслеживания работоспособности отдельного прокси-сервера в группе, назначьте узел сети на этот прокси; в противном случае результаты могут быть нецелостными.
Перераспределение узлов сети
Распределение нагрузки и отказоустойчивость прокси управляются Zabbix сервером через процесс proxy group manager, который постоянно отслеживает состояние всех прокси-серверов в каждой группе прокси и распределение узлов сети на них.
Отказоустойчивость прокси в пределах группы обеспечивается через переключение прокси: при останове прокси его узлы сети немедленно перераспределяются на другие прокси. Также происхоит и распределение нагрузки, поскольку узлы сети переназначаются на прокси с наименьшим числом назначенных на них узлов сети.
Кроме того, распределение нагузки прокси активируется, когда количество узлов сети прокси-сервера отличается от среднего по группе как минимум на 10 узлов сети и в 2 раза (превышение либо недостаток узлов сети). Если дисбаланс сохраняется по истечении льготного периода (10 x задержка переключения), то группа прокси ставится в очередь на перераспределение узлов сети.
Процесс proxy group manager перераспределяет узлы сети, используя следующую логику:
- Вычислить среднее число узлов сети на прокси-сервер.
- Для прокси-серверов с превышением узлов сети — переместить превышающие узлы сети в пул неназначенных прокси-серверов.
- Для прокси-серверов с недостатком узлов сети — посчитать, сколько узлов сети нужно для достижения баланса.
- Убрать нужное число узлов сети от прокси-серверов с наибольшим количеством узлов сети.
- Переместить неназначенные узлы сети на прокси-серверы с наименьшим количеством узлов сети.
Примеры перераспределения узлов сети:
| Узлов сети на прокси-сервере | Среднее по группе | Переназначение узлов сети |
|---|---|---|
| 100 | 50 | Да |
| 60 | 50 | Нет |
| 40 | 50 | Нет |
| 25 | 50 | Да |
| 15 | 5 | Да |
| 10 | 5 | Нет |
Наличие менее чем 10 узлов сети, наблюдаемых через группу прокси, может привести к неравномерному распределению узлов сети между прокси-серверами в этой группе.
Настройка группы прокси
Для настройки группы прокси в веб-интерфейсе Zabbix:
- Перейдите к Администрирование → Группы прокси (Administration → Proxy groups)
- Нажмите Создать группу прокси (Create proxy group)

| Параметр | Описание |
|---|---|
| Имя (Name) | Имя группы прокси-серверов. |
| Период аварийного переключения (Failover period) |
Период в секундах, в течение которого прокси-сервер в группе прокси должен связаться с сервером Zabbix, чтобы считаться онлайн (по умолчанию: 1m; диапазон: 10s-15m). Если прокси не связывается в течение этого периода, состояние прокси меняется на Офлайн (Offline), и его узлы сети немедленно перераспределяются по другим прокси. Распределение нагрузки прокси начинается по истечении этого 10-кратного периода. Поддерживаются суффиксы времени (например, 30s, 1m) и пользовательские макросы. |
| Минимальное количество прокси (Minimum number of proxies) |
Наименьшее число онлайн прокси-серверов, требующихся для поддержания группы прокси онлайн (по умолчанию: 1; диапазон: 1-1000). Поддерживаются пользовательские макросы. Это значение должно быть меньше общего числа прокси-серверов в группе. Например, в группе из 10 прокси, настройка минимума в 10 приведёт к тому, что группа перейдёт в офлайн при сбое любого из прокси-серверов. Обратите внимание, что онлайн-прокси в офлайн-группе продолжают нормально работать, но балансировка нагрузки и отказоустойчивость функционировать не будут. |
| Описание (Description) | Описание группы прокси. |
| Прокси (Proxies) | При редактировании группы с прокси-серверами отображается список — до пяти прокси-серверов (в виде ссылок или обычного текста, в зависимости от прав пользователя на прокси-серверы). |
Настройка балансировки нагрузки прокси
Чтобы использовать балансировку нагрузки прокси, необходимо настроить группу прокси в веб-интерфейсе Zabbix (см. выше) и убедиться, что узлы сети контролируются группой прокси, а не отдельными прокси (можно использовать массовое обновление узлов сети, чтобы перенести их с прокси в группу прокси).
Если используется Zabbix agent, также настройте его следующим образом:
- Для пассивных проверок укажите все прокси группы прокси в параметре Server.
- Для активных проверок рекомендуется указать все прокси группы прокси или Zabbix server в параметре ServerActive. Обратите внимание, что с группами прокси в активном режиме будет работать только Zabbix agent 7.0 (или более поздней версии).
Если параметр ServerActive включает только один прокси из группы прокси (или Zabbix server), агент все равно сможет подключиться к нужному прокси.
Когда служба агента запускается и подключается к указанному прокси, агент получит и сохранит в кэше полный список IP-адресов прокси и их текущую нагрузку в группе.
Затем активные проверки будут перенаправляться на правильный онлайн-прокси для узла сети на основе текущего назначения прокси-узел сети в группе прокси.
Указание только одного прокси в параметре ServerActive Zabbix agent может привести к потере данных мониторинга, если агент будет запущен или перезагружен, когда указанный прокси находится офлайн.
При использовании Zabbix sender запросы данных также перенаправляются на правильный онлайн-прокси для узла сети на основе текущего назначения прокси-узел сети в группе прокси.
Однако если вы отправляете значения нескольких узлов сети из входного файла, используйте опцию -g, чтобы предотвратить отправку данных на неверный прокси.
Zabbix agent также должен иметь возможность подключаться ко всем прокси в группе прокси через межсетевой экран. В противном случае активные проверки могут зависать или завершаться сбоем во время перенаправления или отказоустойчивого переключения. Например:
- Во время активных проверок прокси может перенаправить агента на другой прокси. Если этот прокси заблокирован межсетевым экраном, связь будет зависать в ожидании ответа.
- В стабильных высокодоступных конфигурациях без недавней перебалансировки агенты могут никогда не обращаться к резервным прокси. Если правила межсетевого экрана были изменены и не проверялись, отказоустойчивое переключение может не сработать.
Тестирование балансировки нагрузки прокси
Чтобы протестировать балансировку нагрузки прокси:
- Настройте группу прокси.
- Убедитесь, что группа прокси находится в состоянии онлайн.
- Убедитесь, что узлы сети наблюдаются через группу прокси, а не отдельные прокси-серверы (для перемещения узлов сети от прокси-сервера к группе прокси можно использовать массовое обновление узлов сети).
- Подождите несколько секунд для обновления конфигурации и распределения узлов сети между прокси-серверами в группе прокси. Наблюдайте за изменениями, обновляя список узлов сети в Администрирование (Administration) → Прокси (Proxies).
Важные замечания
- SNMP трапы не поддерживаются прокси-серверами в группе прокси.
- Проверки, зависящие от внешних настроек (например, скрипты для внешних проверок или настройки ODBC для проверок баз данных) должны иметь одинаковую конфигурацию на всех прокси-серверах в группе прокси.
- Проверки баз данных требуют дополнительных разрешений на объектах/серверах баз данных.
- Узлы сети VMware, наблюдаемые через группу прокси, будут случайным образом распределены между прокси-серверами в группе. Это приводит к тому, что каждый прокси кэширует все данные VMware, создавая в итоге дополнительную нагрузку на vCenter.
- Узлы сети, созданные на основе данных авторегистрации от прокси-сервера в группе прокси, настраиваются на наблюдение через эту группу прокси. Однако, узлы сети, созданные на основе данных сетевого обнаружения от прокси-сервера в группе прокси, настраиваются на наблюдение через этот прокси-сервер.