Всем привет. Что-то я искал в интернете по данной проблеме, но ничего не нашел.
Проблема с большой очередью у zabbix-proxy. Всего у меня 7 прокси серверов, а проблема касается в основном двух. На них скапливаются большие очереди, они могут не соединятся с сервером по 5-8 минут и шаблон прокси сервера сообщает об ошибке на этих проксях - Zabbix data sender processes more than 75% busy
Сервер у меня 5 версии
Прокси были Appliance 4.4 на MySQL, которые обновил до 5 версии. Все последние обновления и заббикса и системы установлены.
Остальные 5 прокси делал сам на связке Centos + zabbix-proxy-sqlite3 - с ними таких постоянных проблем нет, хотя бывают.
Сервер
Количество узлов сети (активированных - 103
Количество элементов данных (активированных – 4339
Требуемое быстродействие сервера, новые значения в секунду - 52.98
Сервер имеет ошибку -
Zabbix server - More than 100 items having missing data for more than 10 minutes
Это я так понимаю из-за большой очереди, основную часть которой составляют прокси.
В графиках сервера в ловушках у меня в основном все меньше 5%, только unreachable puller там скачки постоянные 30-50%
System load max – 0.44
CPU load max – 9%
Memory load 40%
Очередь диска - максимальные пики 0.14. Диски SSD – тут все хорошо
Я так понимаю в настройках заббикс сервера параметр StartTrappers отвечает за прокси-сервера. Сначала было по умолчанию и я столкнулся с очередью прокси в 2500 значений. Увеличил этот параметр до 10 и получил около 1000 значений в очереди и как сейчас у меня осталось 2 проблемных прокси. Увеличил это значение StartTrappers до 25, но ничего не поменялось.
Тогда я пошел на Прокси сервера. Там попробовал увеличить значение StartPollers, но ничего не менялось. Если смотреть графики, то очередь на прокси серверах – 0, ловушки все нагружены до 5%, но потом есть обрывы в графиках – данные не поступают.
Если пойти в логи прокси серверов то наблюдаю:
cannot send proxy data to server at "IP_zabbix_server": empty string received
cannot send proxy data to server at " IP_zabbix_server ": ZBX_TCP_WRITE() timed out
В лог-файлах агентов за прокси наблюдаются такие записи:
active check configuration update from [IP_zabbix_proxy:10051] started to fail (ZBX_TCP_READ()
А на самом прокси
resuming Zabbix agent checks on host "Hostname": connection restored
Ошибок связи или связанных с прокси в логах сервера нет.
Если пинговать во время ошибки доступа с прокси севера – Zabbix server – пинги идут, задержки маленькие, пропусков нет. Т.е. сервер Забикс – всегда доступен, но почему-то прокси сервер периодически не может отправить данные.
Помоги, уже все перерыл, ничего не могу найти.
Проблема с большой очередью у zabbix-proxy. Всего у меня 7 прокси серверов, а проблема касается в основном двух. На них скапливаются большие очереди, они могут не соединятся с сервером по 5-8 минут и шаблон прокси сервера сообщает об ошибке на этих проксях - Zabbix data sender processes more than 75% busy
Сервер у меня 5 версии
Прокси были Appliance 4.4 на MySQL, которые обновил до 5 версии. Все последние обновления и заббикса и системы установлены.
Остальные 5 прокси делал сам на связке Centos + zabbix-proxy-sqlite3 - с ними таких постоянных проблем нет, хотя бывают.
Сервер
Количество узлов сети (активированных - 103
Количество элементов данных (активированных – 4339
Требуемое быстродействие сервера, новые значения в секунду - 52.98
Сервер имеет ошибку -
Zabbix server - More than 100 items having missing data for more than 10 minutes
Это я так понимаю из-за большой очереди, основную часть которой составляют прокси.
В графиках сервера в ловушках у меня в основном все меньше 5%, только unreachable puller там скачки постоянные 30-50%
System load max – 0.44
CPU load max – 9%
Memory load 40%
Очередь диска - максимальные пики 0.14. Диски SSD – тут все хорошо
Я так понимаю в настройках заббикс сервера параметр StartTrappers отвечает за прокси-сервера. Сначала было по умолчанию и я столкнулся с очередью прокси в 2500 значений. Увеличил этот параметр до 10 и получил около 1000 значений в очереди и как сейчас у меня осталось 2 проблемных прокси. Увеличил это значение StartTrappers до 25, но ничего не поменялось.
Тогда я пошел на Прокси сервера. Там попробовал увеличить значение StartPollers, но ничего не менялось. Если смотреть графики, то очередь на прокси серверах – 0, ловушки все нагружены до 5%, но потом есть обрывы в графиках – данные не поступают.
Если пойти в логи прокси серверов то наблюдаю:
cannot send proxy data to server at "IP_zabbix_server": empty string received
cannot send proxy data to server at " IP_zabbix_server ": ZBX_TCP_WRITE() timed out
В лог-файлах агентов за прокси наблюдаются такие записи:
active check configuration update from [IP_zabbix_proxy:10051] started to fail (ZBX_TCP_READ()
А на самом прокси
resuming Zabbix agent checks on host "Hostname": connection restored
Ошибок связи или связанных с прокси в логах сервера нет.
Если пинговать во время ошибки доступа с прокси севера – Zabbix server – пинги идут, задержки маленькие, пропусков нет. Т.е. сервер Забикс – всегда доступен, но почему-то прокси сервер периодически не может отправить данные.
Помоги, уже все перерыл, ничего не могу найти.