Ad Widget

Collapse

Выросла нагрузка на CPU после передобавления устройства

Collapse
This topic has been answered.
X
X
 
  • Time
  • Show
Clear All
new posts
  • alibek22
    Member
    • Mar 2022
    • 46

    #1

    Выросла нагрузка на CPU после передобавления устройства

    В Zabbix было добавлено почти 900 устройств, использовалось более 200 шаблонов, почти 40 тысяч единиц данных и почти 20 тысяч триггеров. Требуемое быстродействие 260.
    Нагрузка CPU была при этом менее 5%, что меня очень радовало.
    Сегодня на одном из устройств (у которого было почти 10 тысяч единиц данных) я удалил шаблон, а затем снова его подключил.
    Также примерно в это же время я настроил уведомления в Telegram.
    Теперь нагрузка на CPU около 30%, что уже не радует. Одновременно выросло load average, CPU user time, CPU jumps, disk waiting time, disk read/write rates. И число процессов выросло до примерно 30 тысяч.
    Чем это вызвано? Это временно, пока не утрясется кеш и статистика по вновь собранным данным с передобавленного шаблона? Или это последствия подключения Телеграм? Или теперь так и останется?
    Событий для срабатывания оповещений немного (оповещения настроены на уровень Средний и выше).
    Хотелось бы вернуть нагрузку на прежний уровень. Zabbix так работал уже около недели.
  • Answer selected by alibek22 at 29-03-2022, 14:45.
    alibek22
    Member
    • Mar 2022
    • 46

    Ночью нагрузка вернулась к норме.
    Видимо это была индексация или пересчет статистики.

    Comment

    • Kos
      Senior Member
      Zabbix Certified SpecialistZabbix Certified Professional
      • Aug 2015
      • 3404

      #2
      Побуду немного в роли капитана Очевидность.

      В первую очередь - смотреть не просто цифры нагрузки, а на то, какими процессами эта нагрузка создаётся. Например, в Linux-е есть очень полезная утилита top, с помощью которой можно многое увидеть.

      Затем - разобраться с процессами, число которых "выросло до примерно 30 тысяч". Что это за процессы?
      Все процессы самого сервера Zabbix называются zabbix_server, и их число задаётся в конфигурационном файле сервера Zabbix; если вы не меняли конфиг сервера, то их количество не могло существенно вырасти. Правда, из них могут запускаться и другие (дочерние) процессы - например, скрипты для опроса (если используете) или для отсылки уведомлений, команда fping для ICMP-запросов и т.п.
      Например, в Linux-е можно посмотреть такими командами:
      Code:
      #посмотреть список всех процессов, запущенных от имени пользователя "zabbix"
      ps -fu zabbix
      #посмотреть только длину этого списка (т.е. количество процессов)
      ps -fu zabbix | wc -l
      #посмотреть количество процессов "zabbix_server", запущенных от имени пользователя "zabbix"
      ps -fu zabbix | grep -c zabbix_server
      Аналогичным образом посмотреть процессы, запущенные от имени тех пользователей, от кого работает СУБД, веб-интерфейс и php-fpm (если он используется).

      Рост параметров disk waiting time и disk read/write rates может являться следствием того, что ваша СУБД не справляется с нагрузкой; возможно, имеет смысл подкрутить её параметры (добавить ресурсов на обслуживание базы данных - в первую очередь, RAM под буферы).

      Адекватность количества серверных процессов Zabbix можно оценить по Zabbix-овским графикам "Zabbix data gathering process busy" и "Zabbix internal process busy".

      Comment

      • alibek22
        Member
        • Mar 2022
        • 46

        #3
        Просто характеристики системы ведь не менялись, количество наблюдаемых параметров осталось прежним.
        Количество дочерних процессов Zabbix довольно велико, более 60.
        Но их столько же было и вчера. Нагрузка поменялась после того, как я отсоединил и вновь присоединил шаблон.
        Ну и подключил оповещение Телеграм — но количество уведомлений невелико, навряд ли это увеличило бы нагрузку на сервер.

        Comment

        • alibek22
          Member
          • Mar 2022
          • 46

          #4
          Ночью нагрузка вернулась к норме.
          Видимо это была индексация или пересчет статистики.

          Comment

          Working...