Добрый день.
Конфиг:
Zabbix 6.4. Два сервера с настроенным HA, два прокси, работающих в пассивном режиме.
Проблема:
Периодически то один, то другой прокси перестают отдавать данные серверу и дальше либо ждать, что через полчаса-час они сами очнутся, либо перезапускать их. В любом случае данные, собиравшиеся с агентов за это время теряются бесследно, не смотря на то, что в конфиге проски прописано
ProxyLocalBuffer=2
ProxyOfflineBuffer=72
из чего делаю вывод, что проблема не в сервере и не в связи с ним.
Агент, поставленный на машину с прокси, общается с сервером напрямую и во время этих сбоев продолжает исправно собирать/передавать данные.
Эти машины мониторятся при помощи родного темплейта Zabbix proxy health с git.zabbix.com, но все метрики, за исключением размера очереди, практически не отличаются до, после и во время сбоя.
Каких-то скачков по потреблению памяти или процессора тоже не наблюдается.
При переключении прокси в активный режим падения происходят точно так же.
Обновление до свежей 6.4.8 не помогло.
Увеличение количества поллеров, добавление оперативки машине тоже ничего не дало.
Прикрутил action, который на рост очереди на заббикс прокси их рестартует, но это костыль, а проблема так и остается нерешенной.
Подскажите в какую сторону копать или что еще можно сделать?
Конфиг:
Zabbix 6.4. Два сервера с настроенным HA, два прокси, работающих в пассивном режиме.
Проблема:
Периодически то один, то другой прокси перестают отдавать данные серверу и дальше либо ждать, что через полчаса-час они сами очнутся, либо перезапускать их. В любом случае данные, собиравшиеся с агентов за это время теряются бесследно, не смотря на то, что в конфиге проски прописано
ProxyLocalBuffer=2
ProxyOfflineBuffer=72
из чего делаю вывод, что проблема не в сервере и не в связи с ним.
Агент, поставленный на машину с прокси, общается с сервером напрямую и во время этих сбоев продолжает исправно собирать/передавать данные.
Эти машины мониторятся при помощи родного темплейта Zabbix proxy health с git.zabbix.com, но все метрики, за исключением размера очереди, практически не отличаются до, после и во время сбоя.
Каких-то скачков по потреблению памяти или процессора тоже не наблюдается.
При переключении прокси в активный режим падения происходят точно так же.
Обновление до свежей 6.4.8 не помогло.
Увеличение количества поллеров, добавление оперативки машине тоже ничего не дало.
Прикрутил action, который на рост очереди на заббикс прокси их рестартует, но это костыль, а проблема так и остается нерешенной.
Подскажите в какую сторону копать или что еще можно сделать?
Comment