Ad Widget

Collapse

Очередь в Zabbix

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • garret
    Junior Member
    • Nov 2011
    • 5

    #1

    Очередь в Zabbix

    здравствуйте. никак не можем разобраться с наличием очереди в zabbix'е.
    удалось понизить количество элементов в очереди (>10 мин) с ~300 до ~30-70 за счёт перехода с postgresql на mysql. Система загружена не сильно:
    загрузка ядер около 30%
    память 50%
    диск (atop DSK busy) около 10-40%
    LA 3.14

    Конфигурация системы такая:
    Intel(R) Xeon(R) CPU E5640 @ 2.67GHz 16 ядер
    RAM 24 гб
    Дисковая подсистема - IBM DS3950

    Конфиги в приложении

    Не понятна природа этой очереди, т.е. не ясно во что мы упираемся, в какой ресурс.

    Заранее спасибо!
    Attached Files
    Last edited by garret; 09-11-2011, 08:07.
  • dima_dm
    Senior Member
    • Dec 2009
    • 2697

    #2
    Очередь – это виртуальное отображение, которое показывает на сколько просрочен интервал обновления Items.
    Если есть очередь Администрирование-> Очередь, нужно увеличивать количество Pollers.
    Пример:
    /etc/zabbix/zabbix_server.conf
    StartPollers
    Для разных проверок Poller-ы разные, смотрите конфигурационные параметры
    http://www.zabbix.com/documentation/.../zabbix_server

    Есть Item, по которому можно посмотреть загрузку процессов zabbix.
    http://www.zabbix.com/documentation/...l/config/items
    zabbix[process,<тип>,<режим>,<состояние>]

    Comment

    • dotneft
      Senior Member
      • Nov 2008
      • 699

      #3
      Вот вам шаблончик для мониторинга параметров zabbix сервера. Так же хотелось бы уточнить по количеству итемов, частоте срабатывания проверок. VPS сервера со страницы "Состояние Zabbix".

      Результаты в виде графиков сюда

      ЗЫ: могу точно сказать, что на вашем железе впринципе легко тянуть подобное
      Code:
      Параметр	Значение	Детали
      Zabbix сервер запущен	Да	*:10051
      Количество узлов сети (под наблюдением/без наблюдения/шаблоны)	12868	12759 / 99 / 10
      Количество элементов данных (активных/деактивированых/не поддерживаются)	1484726	1484708 / 6 / 12
      Количество триггеров (активированных/деактивированных)[проблема/неизвестно/ок]	51023	51021 / 2  [28 / 12750 / 38243]
      Количество пользователей (подключенных в данный момент)	118	7
      Требуемое быстродействие сервера, новые значения в секунду	2588.82	 -
      Attached Files

      Comment

      • dotneft
        Senior Member
        • Nov 2008
        • 699

        #4
        Originally posted by garret
        Дисковая подсистема - ibm ds3400
        Проверьте не упираетесь ли в дисковую подсистему. Насколько я знаю линейка ibm ds3400 не держит ssd, имеется вероятность что уперлись

        Comment

        • garret
          Junior Member
          • Nov 2011
          • 5

          #5
          Спасибо за ответы, сейчас постараюсь собрать нужные данные:

          Number of hosts (monitored/not monitored/templates) 903 687 / 24 / 192
          Number of items (monitored/disabled/not supported) 13554 10456 / 263 / 2835
          Number of triggers (enabled/disabled)[problem/unknown/ok] 13129 12053 / 1076 [836 / 345 / 10872]
          Number of users (online) 44 8
          Required server performance, new values per second 372.61 -

          Полеров итак много вроде - 200. Пробовали 255 ставить - лучше не становится.
          Может сетку надо тюнить....

          Originally posted by dima_dm
          zabbix[process,<тип>,<режим>,<состояние>]
          Это полезная информация, попробую.

          То, что на этом железе можно тянуть много больше, это без сомнения. Хочется узнать как =)))

          Дисковую подсистему проверю. Кстати, я попутал, заббикс живёт на другой дисковой полке - 3950
          Там интерфейс FC. Но всё равно сейчас поснимаю данные производительности.

          Вот еще параметры sysctl:
          net.core.rmem_max = 1048576
          net.core.wmem_max = 1048576
          net.core.rmem_default = 1048576
          net.core.wmem_default = 1048576
          net.ipv4.conf.all.accept_redirects = 0
          net.ipv4.conf.default.accept_redirects = 0
          net.ipv4.icmp_echo_ignore_broadcasts = 1
          net.core.netdev_max_backlog = 2048
          net.core.somaxconn = 4096
          net.ipv4.tcp_orphan_retries = 1
          net.ipv4.tcp_max_syn_backlog = 4096
          net.ipv4.tcp_syncookies = 1
          net.ipv4.tcp_fin_timeout = 15
          net.ipv4.tcp_synack_retries = 2
          net.ipv4.tcp_syn_retries = 2
          net.ipv4.tcp_keepalive_time = 60
          net.ipv4.tcp_keepalive_probes = 3
          net.ipv4.tcp_keepalive_intvl = 5
          net.ipv4.tcp_window_scaling = 0
          net.ipv4.tcp_sack = 0
          net.ipv4.tcp_timestamps = 0
          net.ipv4.ip_local_port_range = 1024 61000
          net.ipv4.tcp_reordering = 20
          net.ipv4.udp_rmem_min = 16384
          net.ipv4.udp_wmem_min = 16384
          net.ipv4.tcp_rmem = 8192 87380 8388608
          net.ipv4.tcp_wmem = 8192 65536 8388608
          net.ipv4.tcp_mem = 8388608 12582912 16777216
          net.ipv4.udp_mem = 8388608 12582912 16777216
          vm.swappiness = 30
          vm.dirty_ratio = 50
          net.ipv4.conf.all.accept_redirects = 0
          net.ipv4.tcp_no_metrics_save = 1
          kernel.shmmax = 8589934592
          kernel.shmall = 16777216
          fs.file-max = 999999
          Attached Files
          Last edited by garret; 09-11-2011, 09:37.

          Comment

          • garret
            Junior Member
            • Nov 2011
            • 5

            #6
            Разобрался Всё было очень просто. Агенты слишком долго не отдавали данные, что не укладывалось в заданный на сервере таймаут в 5 сек. Пришлось увеличить до 15 сек. Т.к. поллеры теперь могут работать дольше и не приниматься за следующий параметр, пока не закончат текущий (который долго собирается), пришлось увеличить и количество поллеров.
            В итоге сейчас очередь стала вся зелёненькая )

            Comment

            • gdgsoft
              Senior Member
              • Apr 2009
              • 202

              #7
              Originally posted by dotneft
              Attached Files template_zbx_srv.xml (47.0 KB, 5 views)
              [/CODE]
              Какой то транный шаблон У меня при импорте этого шаблона ошибка. Мои шаблоны затягивает нормально.
              Zabbix 1.8.8
              Attached Files
              Zabbix 2.4.2
              PHP 5.4.5
              Oracle Linux 6.5
              VmWare ESXi 4

              MariaDB 10.0.15
              Oracle Linux 6.5
              Supermicro SYS-6027TRF(64Gb+RAID-10 600Gb SAS15k)

              Comment

              • dotneft
                Senior Member
                • Nov 2008
                • 699

                #8
                может быть я забыл уточнить что шаблон для 2.0 версии заббикс

                Comment

                • garret
                  Junior Member
                  • Nov 2011
                  • 5

                  #9
                  Как кстати вторая версия? глюков много? как считаете, при релизе уже можно на неё переходить? много ли проблем совместимости вылезает с переходом с 1.8 на 2.0?

                  Comment

                  • dotneft
                    Senior Member
                    • Nov 2008
                    • 699

                    #10
                    Originally posted by garret
                    Как кстати вторая версия? глюков много? как считаете, при релизе уже можно на неё переходить? много ли проблем совместимости вылезает с переходом с 1.8 на 2.0?
                    достаточно а так неплохо

                    Comment

                    • ruri
                      Junior Member
                      • Jun 2010
                      • 20

                      #11
                      Такая же проблема.
                      Поллеры увеличил до 50, таймаут до 30
                      Не помогает. Причём в очереди (перые 500 записей) исключительно итемы PPS.
                      При этом идле машины 70%.

                      Zabbix 1.8.13

                      Comment

                      Working...