Ad Widget

Collapse

Непонятная периодическая загрузка по LA (Load Average) на Zabbix server 4.0.6

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • kostenelo
    Junior Member
    • Apr 2019
    • 9

    #1

    Непонятная периодическая загрузка по LA (Load Average) на Zabbix server 4.0.6

    Имеется несколько серверов (хостов виртуализации) в одном датацентре и для мониторинга их работы на один из хостов в непривилегированный LXC контейнер был установлен Zabbix server. Настройки доступных ресурсов: 1vCPU (unlimited, Core [email protected] 4c/8th), RAM 512Mb, Swap 512Mb, SSD raw disk 8Gb.
    Количество узлов сети (активированных/деактивированных/шаблонов) 88 (9 / 0 / 79)
    Количество элементов данных (активированных/деактивированных/неподдерживаемых) 631 (595 / 0 / 36)
    Количество триггеров (активированных/деактивированных [проблема/ок]) 365 ( 365 / 0 [0 / 365])
    Требуемое быстродействие сервера, новые значения в секунду 6.65

    Помимо стандартных шаблонов используются HDD_SMARTMONTOOLS_2_WITH_LLD,Template MD Soft RAID, Windows Event Log, мониторятся логи на некоторые ошибки и события безопасности.
    Размер базы:
    du -h /var/lib/mysql/zabbix
    949M /var/lib/mysql/zabbix

    Передача данных шифруется через PSK.

    Примерно через 1ч..1ч 20мин возникают необъяснимые скачки system.cpu.load[percpu,avg1] до 0,3..0,7
    На хосте виртуализации наблюдаются похожая ситуация.
    На форуме странное ограничение на 5 файлов в сообщении, поэтому загрузил все 10-ть графиков производительности на https://yadi.sk/d/ASTRkGUr_HvFTA

    Я пробовал:
    Обновлять версии Zabbix server и агента
    Мониторить загрузку CPU, дисков и сети с помощью top, ps, htop, atop, iostat. Нигде не видно нагрузки - просто у хоста ползёт вверх LA
    Отключать все элементы данных и LLD правила обнаружения и процессы с периодичностью в 1ч
    Менять периодичность housekeeper.

    Странные скачки LA пропадают если выключить Zabbix server (остановить его LXC контейнер)

    На этом же хосте работает виртуальная машина с терминальным сервером и один пользователь жалуется на периодические подвисания окна с RDP (хотя я склонен считать что проблема в Wifi через который пользователь работает).

    Прошу помочь разобраться:
    1. Действительно ли Zabbix server чего-то не хватает
    2. Может ли Zabbix server загружать на несколько минут систему Core i7-6700 (3.40GHz 4c/8th), RAM 32GB, SSD и Gbit/s bandwidth чтобы это сказывалось на работе других виртуальных машин на этом хосте?



  • Semiadmin
    Senior Member
    • Oct 2014
    • 1625

    #2
    В качестве предположения, без какой-либо оценки ресурсов...Я знаю только одно событие, которое неизбежно происходит именно в начале каждого часа - вычисление трендов.

    Comment

    • kostenelo
      Junior Member
      • Apr 2019
      • 9

      #3
      Originally posted by Semiadmin
      В качестве предположения, без какой-либо оценки ресурсов...Я знаю только одно событие, которое неизбежно происходит именно в начале каждого часа - вычисление трендов.
      Возможно, приложил к первому сообщению не очень удачные графики - скачки LA происходят периодически, но не привязаны к началу часа. Как они выглядят сейчас можно увидеть в приложенной к этому сообщению картинке. Любопытно, что между пиками скачков обычно 65..70мин. Похоже время для следующего запуска начинает отсчитываться с момента окончания предыдущего запуска (сам скачёк длится обычно минут 5..10, прикладываю график в минутном масштабе) .
      Attached Files

      Comment

      Working...