Поделитесь как правильно сконфигурировать пулеры на Сервере и Прокси.
Имеем конфиг:
1) Сервер - виртуалка, (CPU 1x4, RAM 8Gb)
2) WEB-сервер - выделенный сервер: HP 380G6 (CPU 1x4, RAM 6Gb)
3) Сервер БД - выделенный сервер: Supermicro 6027R-TRF (CPU 2x8, RAM 64Gb, RAID10 SAS600Gb 10k кеш 1Gb)
4) 7 прокси серверов - выделенные сервера: Supermicro 6017R-TDF (CPU 1x4, RAM 8Gb, RAID1 SAS300Gb 10k)
И всю эту "мощу" поставил на колени Zabbix 2.2
Суть проблемы - бешенные очереди в Admin -> Queue и, как следствие, куча активных триггеров, срабатывающих как попало.
На сегодня активных Item-ов 391640. В очереди >10мин висит >24000
Более-менее с этим борохлом справлялась версия 2.2.2. Но в ней был баг (если я правильно понял) с тем, что она не правильно считала количество свободной памяти в некоторых элементах и в результате мы получали периодические ее креши.
При переходе на 2.2.3 (сервер+прокси) падает сервер Zabbix, когда как. Когда через пару дней, а когда и 2 недели мог проработать. Причем 100% падал, если Сервер и Прокси были версиии 2.2.3. Ставили Сервер 2.2.3, а Прокси 2.2.2, тогда работало более менее.
Идей о том в чем может проблема уже нет.
В качестве БД используем Maria DB 10, в качестве ОС на серваке сейчас Oracle Linux. До этого пробовали Ubunta Linux 9. Все тоже самое.
Ресурсы по БД:
CPU util ~20%
RAM ~30%
IO <4%
Загрузка Zabbix-сервера:
CPU ~50%
RAM ~90% (скорее всего из-за ZFS)
Загрузка WEB-сервера:
CPU ~10%
Трафик на интерфейсах основных серверов порядка 25Мбит (на каждом).
Все что приходит в голову, некорректно сконфигурированы пулеры на Сервере и Проксях.
Сейчас параметры пулеров на каждом проксике индивидуальные. Их изменение ни к чему ни приводит. Хочешь ставь 40, хочешь, ставь 80, очередь не уходит.
На Zabbix-сервере стоит свое количество пулеров исходя из элементов, которые он сам непосредственно обрабатывает.
Вот вопрос...
Правильно ли выставляются пулера на основном сервере (в зависимости от количества обрабатываемых Item) или необходимо, что бы на основном сервере количество пулеров было равно сумме пуллеров на всех остальных прокси-серверах?
Прокси-сервера работают в активном режиме, поэтому предполагалось, что всю инициацию опросов оборудования осуществляет сам прокси и основному серваку большое количество пулеров ни к чему.
Основная масса Item это активные SNMP элементы, порядка 60%. Порядка 35% zabbix_trapper. Остальная шушара – 5%.
Динамических Item-ов нет.
По времени сервера засинхронизированы, вроде
Что скажите?
Имеем конфиг:
1) Сервер - виртуалка, (CPU 1x4, RAM 8Gb)
2) WEB-сервер - выделенный сервер: HP 380G6 (CPU 1x4, RAM 6Gb)
3) Сервер БД - выделенный сервер: Supermicro 6027R-TRF (CPU 2x8, RAM 64Gb, RAID10 SAS600Gb 10k кеш 1Gb)
4) 7 прокси серверов - выделенные сервера: Supermicro 6017R-TDF (CPU 1x4, RAM 8Gb, RAID1 SAS300Gb 10k)
И всю эту "мощу" поставил на колени Zabbix 2.2

Суть проблемы - бешенные очереди в Admin -> Queue и, как следствие, куча активных триггеров, срабатывающих как попало.
На сегодня активных Item-ов 391640. В очереди >10мин висит >24000
Более-менее с этим борохлом справлялась версия 2.2.2. Но в ней был баг (если я правильно понял) с тем, что она не правильно считала количество свободной памяти в некоторых элементах и в результате мы получали периодические ее креши.
При переходе на 2.2.3 (сервер+прокси) падает сервер Zabbix, когда как. Когда через пару дней, а когда и 2 недели мог проработать. Причем 100% падал, если Сервер и Прокси были версиии 2.2.3. Ставили Сервер 2.2.3, а Прокси 2.2.2, тогда работало более менее.
Идей о том в чем может проблема уже нет.
В качестве БД используем Maria DB 10, в качестве ОС на серваке сейчас Oracle Linux. До этого пробовали Ubunta Linux 9. Все тоже самое.
Ресурсы по БД:
CPU util ~20%
RAM ~30%
IO <4%
Загрузка Zabbix-сервера:
CPU ~50%
RAM ~90% (скорее всего из-за ZFS)
Загрузка WEB-сервера:
CPU ~10%
Трафик на интерфейсах основных серверов порядка 25Мбит (на каждом).
Все что приходит в голову, некорректно сконфигурированы пулеры на Сервере и Проксях.
Сейчас параметры пулеров на каждом проксике индивидуальные. Их изменение ни к чему ни приводит. Хочешь ставь 40, хочешь, ставь 80, очередь не уходит.
На Zabbix-сервере стоит свое количество пулеров исходя из элементов, которые он сам непосредственно обрабатывает.
Вот вопрос...
Правильно ли выставляются пулера на основном сервере (в зависимости от количества обрабатываемых Item) или необходимо, что бы на основном сервере количество пулеров было равно сумме пуллеров на всех остальных прокси-серверах?
Прокси-сервера работают в активном режиме, поэтому предполагалось, что всю инициацию опросов оборудования осуществляет сам прокси и основному серваку большое количество пулеров ни к чему.
Основная масса Item это активные SNMP элементы, порядка 60%. Порядка 35% zabbix_trapper. Остальная шушара – 5%.
Динамических Item-ов нет.
По времени сервера засинхронизированы, вроде

Что скажите?

Comment