Ad Widget

Collapse

2.0.5->2.2.2 Проблемы с snmp

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • rpra
    Junior Member
    • Sep 2013
    • 4

    #1

    2.0.5->2.2.2 Проблемы с snmp

    После апгрейда вижу что SNMP стал работать гораздо медленнее, в очереди куча элементов, на графиках видны потери данных.

    Особенность моей конфигурации в том что весь snmp мониторинг удаленный через инет и часто по тормозным каналам, но на 2.0 особых проблем не было.

    Может быть как-то можно настроить параметры snmp агента?
  • rpra
    Junior Member
    • Sep 2013
    • 4

    #2
    Даунгрейд до 2.0.11 помог.
    Проблема явно в новой версии

    Comment

    • pzabortsev
      Senior Member
      • Dec 2012
      • 338

      #3
      А как даунгрейд делали? Просто вернулись к сохраненной прежде базе?

      Насчет snmp - тут уже обсуждались какие-то динамические индексы (может я путаю название). Если Вы их используете, то, я так понял, в 2.2 должны быть проблемы. Поищите по форуму...

      Comment

      • rpra
        Junior Member
        • Sep 2013
        • 4

        #4
        Originally posted by pzabortsev
        А как даунгрейд делали? Просто вернулись к сохраненной прежде базе?
        Да, ну бинарники переставил ессно.

        Originally posted by pzabortsev
        Насчет snmp - тут уже обсуждались какие-то динамические индексы (может я путаю название). Если Вы их используете, то, я так понял, в 2.2 должны быть проблемы. Поищите по форуму...
        Да, используем широко динамические индексы, так же как и lld.
        Попробую найти причину и, возможно, решение...

        Comment

        • kostil
          Junior Member
          • Oct 2011
          • 11

          #5
          Здравствуйте, коллеги.

          Удалось ли найти решение проблемы? Недавно обновился с 2.0.11 до 2.2.2 - столкнулся с подобной проблемой. Все графики рваные, хотя устройства в рамках одной ethernet сети.

          Так же периодически стал отваливаться zabbix-agent на удаленных машинах. На 2.0.11 таких проблем не было.
          Last edited by kostil; 11-03-2014, 10:09.

          Comment

          • Jimson
            Senior Member
            • Jan 2008
            • 1327

            #6
            Есть предположение что надо увеличивать размер shared memory кэша при апгрейде до 2.2
            ValueCacheSize - по умолчанию 8 мегабайт.
            Last edited by Jimson; 11-03-2014, 11:04.

            Comment

            • kostil
              Junior Member
              • Oct 2011
              • 11

              #7
              Изменил в конфиге ValueCacheSize=128M - не помогло

              Comment

              • kostil
                Junior Member
                • Oct 2011
                • 11

                #8
                Покрутил конфиг:

                Code:
                CacheSize=128M
                HistoryCacheSize=128M
                TrendCacheSize=128M
                HistoryTextCacheSize=256M
                ValueCacheSize=256M
                Результат не дало
                Кто нибудь заставил работать 2.2.2?

                Comment

                • enzorik
                  Member
                  • Feb 2014
                  • 37

                  #9
                  Покажите статистику пулеров заббикса.
                  Вот пример.

                  Comment

                  • kostil
                    Junior Member
                    • Oct 2011
                    • 11

                    #10
                    Вот статистика

                    Вчера поменял

                    Code:
                    # StartPollers=5
                    StartPollers=20
                    Графики стали не рваные, но сильно ступенчатые, по сравнению с тем что были до обновления.
                    Вот график пулеров
                    Поднять значение StartPollers или проблема где-то еще?
                    Last edited by kostil; 14-03-2014, 08:01.

                    Comment

                    • Jimson
                      Senior Member
                      • Jan 2008
                      • 1327

                      #11
                      Конечно мало, в нормальном режиме должно быть максимум процентов 20 занятости, с учетом того что при сбоях в сети нагрузка на пуллеры будет на порядок выше.
                      У меня другой вопрос: какой у вас nvps?
                      И второй вопрос, в frontend есть статистика по очередям, а точнее по кол-ву элементов данных опрос которых запаздывает, вы в нее смотрите?

                      Comment

                      • kostil
                        Junior Member
                        • Oct 2011
                        • 11

                        #12
                        Вот что касается nvps

                        По второму вопросу нет. Подскажите где ее посмотреть?

                        Comment

                        • Jimson
                          Senior Member
                          • Jan 2008
                          • 1327

                          #13
                          Ну по меню интерфейсному вы сами уж можетесь пройтись без помощи комьюнити?! "Очередь" - так и называется.

                          Смотрите, у вас 21 новое значение в секунду производительность, пулеров запущено 20 штук и при это они все заняты (вы это не только по графику можете увидеть, а просто посмотрев `ps ax` в статусе процессов будет написано свободен он или занят). Выходит у вас получение значение занимает секунду, вы через спутниковый линк опрашиваете хост?

                          Последите внимательно за процессами, если они действительно все время чем то заняты, и это у вас не спутниковые каналы, то надо открывать тикет, ибо в таком случае очень интересно что же такого там пулеры делают.

                          Вот у меня есть похожая нагрузка на одном из активных прокси на старой версии (2.0.6):
                          msk-be-zbx-vpn278 Активный 2с 234 3744 25.14

                          не менее 2500 элементов данных это опросы по SNMP спутниковых VSAT (задержка в среднем 750ms)
                          Code:
                          msk-be-srv-znet VPN-278 [root]:/ # ps axw | g -v grep | g ': poller' | g 'getting values'| wc -l
                                13
                          msk-be-srv-znet VPN-278 [root]:/ # ps axw | g -v grep | g ': poller' | g 'getting values'| wc -l
                                13
                          msk-be-srv-znet VPN-278 [root]:/ # ps axw | g -v grep | g ': poller' | g 'getting values'| wc -l
                                13
                          msk-be-srv-znet VPN-278 [root]:/ # ps axw | g -v grep | g ': poller' | g 'getting values'| wc -l
                                11
                          msk-be-srv-znet VPN-278 [root]:/ # ps axw | g -v grep | g ': poller' | g 'getting values'| wc -l
                                11
                          msk-be-srv-znet VPN-278 [root]:/ # ps axw | g -v grep | g ': poller' | g 'getting values'| wc -l
                                13
                          и это при том что определенный процент опросов вообще по 30 секунд занимает (не отвечает VSAT, например, погода плохая и он отвалился)

                          Comment

                          Working...