Ad Widget

Collapse

zabbix poller processes mere than 75% busy zabbix 3.0

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • krokoz
    Junior Member
    • Feb 2016
    • 8

    #1

    zabbix poller processes mere than 75% busy zabbix 3.0

    Zabbix 3.0 Ubuntu server 14.04
    MySQL 5.7.10 Ubuntu server 14.04
    90 хостов, 25000 итемов, среднее время опроса 45 секунд.
    В начале было 60 poller'ов, средняя загрузка колебалась от 50 до 60%. В один из дней стало вываливать за 80%, увеличивал количество poller'ов с шагом 20 до 160. Загрузка так и не упала ниже 75.
    Куда копать дальше?
  • sadman
    Senior Member
    • Dec 2010
    • 1611

    #2
    Смотреть очередь - какие хосты долго не отдают пулерам данные. Проводить с ними разъяснительную работу. Переводить на "Zabbix (active)".

    Comment

    • krokoz
      Junior Member
      • Feb 2016
      • 8

      #3
      В логах раз в полчаса проскакивал один и тот же коммутатор, итемы при этом разные.
      Проблема решилась путем сокращения StartPollers до 40, увеличения StartPollersUnreachable и StartPingers до 10.
      Загрузка упала до среднего значения 44%.

      Comment

      • cancer_zern
        Member
        • Apr 2015
        • 36

        #4
        Originally posted by krokoz
        В логах раз в полчаса проскакивал один и тот же коммутатор, итемы при этом разные.
        Проблема решилась путем сокращения StartPollers до 40, увеличения StartPollersUnreachable и StartPingers до 10.
        Загрузка упала до среднего значения 44%.

        Comment

        • flyxman
          Junior Member
          • Apr 2016
          • 9

          #5
          Всем добрый день!
          Zabbix 3.0.2
          CentOS 7.2.1511
          RAM 4GB
          CPU 4vCPU
          DB: PostgreSQL 9.5.2
          Number of hosts: 59
          Number of items: 26312
          Required server performance, new values per second 151.49

          В один прекрасный день я решил мигрировать zabbix c Centos 6 на Centos 7.
          Загрузка пуллеров была стабильной в районе 20%.
          После миграции без видимых на то причин загрузка выросла до не стабильно 70%-100%.
          Я в какой то момент подумал, что виновата база, после чего прикрутил партиционирование настроил в забиксе мониторинг медленных транзакций меньше 500 миллисекунд, insert среди них нет, да и вообще таких запросов крайне мало. Очереди в забиксе очень маленькие и кратковременные порядка 20.
          Конфиг забикс сервера:
          Code:
          LogFile=/var/log/zabbix/zabbix_server.log
          LogFileSize=0
          PidFile=/var/run/zabbix/zabbix_server.pid
          DBName=zabbix
          DBUser=zabbix
          StartPollers=15
          StartIPMIPollers=3
          StartVMwareCollectors=1
          SNMPTrapperFile=/var/log/snmptt/snmptt.log
          StartSNMPTrapper=1
          HousekeepingFrequency=0
          CacheSize=64M
          AlertScriptsPath=/usr/lib/zabbix/alertscripts
          ExternalScripts=/usr/lib/zabbix/externalscripts
          LogSlowQueries=500
          Увеличение StartPollers не приводит к видимым результатам.
          В какую сторону копать уже даже и не знаю.

          График миграции на CenOS 7


          Code:
          poller #1 [got 30 values in 4.935140 sec, getting values]
          poller #2 [got 37 values in 5.155225 sec, getting values]
          poller #3 [got 26 values in 5.007208 sec, getting values]
          poller #4 [got 26 values in 5.054302 sec, getting values]
          poller #5 [got 40 values in 5.109473 sec, getting values]
          poller #6 [got 37 values in 5.258803 sec, getting values]
          poller #7 [got 21 values in 3.199549 sec, getting values]
          poller #8 [got 23 values in 3.126580 sec, getting values]
          poller #9 [got 26 values in 5.024158 sec, getting values]
          poller #10 [got 25 values in 4.974539 sec, getting values]
          poller #11 [got 34 values in 5.114749 sec, getting values]
          poller #12 [got 19 values in 3.105736 sec, getting values]
          poller #13 [got 18 values in 3.147873 sec, getting values]
          poller #14 [got 24 values in 4.779532 sec, getting values]
          poller #15 [got 47 values in 5.149684 sec, getting values]
          Есть идеи?

          Comment

          • bboyshock
            Member
            • May 2016
            • 93

            #6
            Можно скрин zabbix data gatharing process busy%?

            Comment

            • flyxman
              Junior Member
              • Apr 2016
              • 9

              #7
              у меня к сожалению нет такой метрики.
              и в https://www.zabbix.com/documentation...types/internal
              я её тоже не нашел.
              Как быть?

              Comment

              • bboyshock
                Member
                • May 2016
                • 93

                #8
                Originally posted by flyxman
                у меня к сожалению нет такой метрики.
                и в https://www.zabbix.com/documentation...types/internal
                я её тоже не нашел.
                Как быть?
                А где вы смотрите? В графиках zabbix server?

                Comment

                • flyxman
                  Junior Member
                  • Apr 2016
                  • 9

                  #9
                  Приношу свои извинения, я искал метрику, а нужно было искать график. Я просто графиками пользуюсь очень редко, в основном через LatestData выбираю нужные метрики и смотрю график.
                  Вот тут переход на CentOS 7.
                  Last edited by flyxman; 07-05-2016, 21:45.

                  Comment

                  • bboyshock
                    Member
                    • May 2016
                    • 93

                    #10
                    вам нужно установить количество startpollers не меньше 15-20. Мне помогло одно время. Выберите оптимальное число для себя по графику
                    У меня так

                    Comment

                    • flyxman
                      Junior Member
                      • Apr 2016
                      • 9

                      #11
                      Как я и писал в начале, у меня startpollers 15 штук и увеличение не приводит к видимым результатам.

                      Comment

                      • bboyshock
                        Member
                        • May 2016
                        • 93

                        #12
                        пробовали еще добавить?

                        Comment

                        • bboyshock
                          Member
                          • May 2016
                          • 93

                          #13
                          в моей конфе их вообще 25 при 151 активном узле.
                          я также включал startdicoverers

                          Comment

                          • flyxman
                            Junior Member
                            • Apr 2016
                            • 9

                            #14
                            Я разобрался в проблеме, обнаружил хост в котором у меня было 14000 items, я не смог удалить этот хост с помощью веб интерфейса, но я удалил его из базы и всё стало на свои места, загрузка с пуллеров упала в пол.

                            Comment

                            Working...