Имеется несколько серверов (хостов виртуализации) в одном датацентре и для мониторинга их работы на один из хостов в непривилегированный LXC контейнер был установлен Zabbix server. Настройки доступных ресурсов: 1vCPU (unlimited, Core [email protected] 4c/8th), RAM 512Mb, Swap 512Mb, SSD raw disk 8Gb.
Количество узлов сети (активированных/деактивированных/шаблонов) 88 (9 / 0 / 79)
Количество элементов данных (активированных/деактивированных/неподдерживаемых) 631 (595 / 0 / 36)
Количество триггеров (активированных/деактивированных [проблема/ок]) 365 ( 365 / 0 [0 / 365])
Требуемое быстродействие сервера, новые значения в секунду 6.65
Помимо стандартных шаблонов используются HDD_SMARTMONTOOLS_2_WITH_LLD,Template MD Soft RAID, Windows Event Log, мониторятся логи на некоторые ошибки и события безопасности.
Размер базы:
du -h /var/lib/mysql/zabbix
949M /var/lib/mysql/zabbix
Передача данных шифруется через PSK.
Примерно через 1ч..1ч 20мин возникают необъяснимые скачки system.cpu.load[percpu,avg1] до 0,3..0,7
На хосте виртуализации наблюдаются похожая ситуация.
На форуме странное ограничение на 5 файлов в сообщении, поэтому загрузил все 10-ть графиков производительности на https://yadi.sk/d/ASTRkGUr_HvFTA
Я пробовал:
Обновлять версии Zabbix server и агента
Мониторить загрузку CPU, дисков и сети с помощью top, ps, htop, atop, iostat. Нигде не видно нагрузки - просто у хоста ползёт вверх LA
Отключать все элементы данных и LLD правила обнаружения и процессы с периодичностью в 1ч
Менять периодичность housekeeper.
Странные скачки LA пропадают если выключить Zabbix server (остановить его LXC контейнер)
На этом же хосте работает виртуальная машина с терминальным сервером и один пользователь жалуется на периодические подвисания окна с RDP (хотя я склонен считать что проблема в Wifi через который пользователь работает).
Прошу помочь разобраться:
1. Действительно ли Zabbix server чего-то не хватает
2. Может ли Zabbix server загружать на несколько минут систему Core i7-6700 (3.40GHz 4c/8th), RAM 32GB, SSD и Gbit/s bandwidth чтобы это сказывалось на работе других виртуальных машин на этом хосте?
Количество узлов сети (активированных/деактивированных/шаблонов) 88 (9 / 0 / 79)
Количество элементов данных (активированных/деактивированных/неподдерживаемых) 631 (595 / 0 / 36)
Количество триггеров (активированных/деактивированных [проблема/ок]) 365 ( 365 / 0 [0 / 365])
Требуемое быстродействие сервера, новые значения в секунду 6.65
Помимо стандартных шаблонов используются HDD_SMARTMONTOOLS_2_WITH_LLD,Template MD Soft RAID, Windows Event Log, мониторятся логи на некоторые ошибки и события безопасности.
Размер базы:
du -h /var/lib/mysql/zabbix
949M /var/lib/mysql/zabbix
Передача данных шифруется через PSK.
Примерно через 1ч..1ч 20мин возникают необъяснимые скачки system.cpu.load[percpu,avg1] до 0,3..0,7
На хосте виртуализации наблюдаются похожая ситуация.
На форуме странное ограничение на 5 файлов в сообщении, поэтому загрузил все 10-ть графиков производительности на https://yadi.sk/d/ASTRkGUr_HvFTA
Я пробовал:
Обновлять версии Zabbix server и агента
Мониторить загрузку CPU, дисков и сети с помощью top, ps, htop, atop, iostat. Нигде не видно нагрузки - просто у хоста ползёт вверх LA
Отключать все элементы данных и LLD правила обнаружения и процессы с периодичностью в 1ч
Менять периодичность housekeeper.
Странные скачки LA пропадают если выключить Zabbix server (остановить его LXC контейнер)
На этом же хосте работает виртуальная машина с терминальным сервером и один пользователь жалуется на периодические подвисания окна с RDP (хотя я склонен считать что проблема в Wifi через который пользователь работает).
Прошу помочь разобраться:
1. Действительно ли Zabbix server чего-то не хватает
2. Может ли Zabbix server загружать на несколько минут систему Core i7-6700 (3.40GHz 4c/8th), RAM 32GB, SSD и Gbit/s bandwidth чтобы это сказывалось на работе других виртуальных машин на этом хосте?
Comment