Ad Widget

Collapse

Как добиться максимальной утилизации поллеров?

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • balduser
    Junior Member
    • Oct 2022
    • 16

    #1

    Как добиться максимальной утилизации поллеров?

    Добрый день.
    В нашей компании Zabbix (5.0.21) используется для сбора данных с огромной сети. В работе несколько серверов, каждый имеет по несколько прокси и мониторит определённый регион. Уже привычна ситуация, что на сервере или прокси может быть постоянная утилизация поллеров 100, из-за чего очередь может держаться в районе 0.5-1.5 М. Стараемся распределять нагрузку на прокси по мере возможности.
    Непонятно следующее. Есть zbx сервер, на котором работают 900 поллеров. Средняя за сутки утилизация поллеров на отметке 75%, но средняя очередь 1.1 Млн. Почему поллеры не загружены на 100 %?
    Самые важные графики прикрепил, могу добавить недостающие.
    Также хотелось бы понять, почему график очереди как правило имеет форму пилы - практически везде очередь с интервалами
    Attached Files
  • balduser
    Junior Member
    • Oct 2022
    • 16

    #2
    Забыл добавить, может важно: база для сервера реализована на отдельной ВМ, 12 ядер, 128 GiB RAM.
    Attached Files

    Comment

    • balduser
      Junior Member
      • Oct 2022
      • 16

      #3
      Ещё графики
      Attached Files

      Comment

      • balduser
        Junior Member
        • Oct 2022
        • 16

        #4
        И ещё немного
        Attached Files

        Comment

        • Hamardaban
          Senior Member
          Zabbix Certified SpecialistZabbix Certified Professional
          • May 2019
          • 2713

          #5
          Добиться "100% загрузки полеров" просто - нужно уменьшить их количество! :-) (хоть и шутка, но это так.)
          Тут важно понимать что стоит за этими показателями "загрузками" (см документацию). Общий принцип: чем меньше загрузка - тем лучше.(до определенного предела конечно)

          Как понимаю вас заботит повышение производительности системы \ снижение "очереди" ? Т.е. достижение состояния при котором "все данные собираются и нет затыков с производительностью"?

          Тут рецепты давать на основании нескольких графиков не выйдет... Только "погружение" во все аспекты ваших систем...
          Например типы агентов оп хостам (активные\пассивные), типы прокси, базы под прокси, тюнинг основной базы,использование timescaledb и т.д. и т.п.

          Совет первый (всепокрывающий) - наймите специалиста по забиксу или обратитесь к разработчику (второе как понимаю для вас неосуществимо)
          Совет второй (частный) - уберите с сервера все сборщики данных - вынесите их на прокси. Увеличивайте количество\качество территориальных прокси пока не станет хорошо. обратите внимание на обработку недоступности узлов. переработайте шаблоны убрав лишнее.
          Совет третий (очевидный) - обновите систему. В новых версиях много чего переделывали.​

          Comment

          • Griboed0ff
            Senior Member
            • Sep 2022
            • 153

            #6
            Еще совет по очереди, берите значения очередей из баз прокси. Там реальная очередь, значения, которые еще не отправлены. Если эти значения намного меньше чем вы видите в интерфейсе, то действительно идите искать проблемы со сбором элементов данных. Очередь в интерфейсе она условная и если, например, у вас активные проверки и агенты не прислали информацию, то сервер будет "думать", что есть проблема сбора и накинет число в очереди. А вообще в момент проблемы, посмотрите, что там вообще в очереди, какие элементы данных имеют проблемы и решайте эти проблемы.

            Comment

            • Alex_UUU
              Senior Member
              • Dec 2018
              • 541

              #7
              Еще заметка: если время на узле сети - липовое, то тоже растет очередь. Очень часто бывает очередь просто с конкретного узла сети. Хотя и данных там мало, но вот всегда 11 минут.

              Comment

              Working...