Ad Widget

Collapse

Проблема с расчётом delta (speed per second)

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • mort
    Junior Member
    • Dec 2017
    • 19

    #1

    Проблема с расчётом delta (speed per second)

    Добрый день, коллеги.

    Проблема тянется с момента выхода версии заббикса 3.0 lts, текущая установленная 3.0.13.
    • Проблема наблюдается только у пары устройств. На всех хостах в системе одинаковый oid snpmv2, используется ifHCInOctets и ifHCOutOctets.
    • У проблемных ломается график (и в пиках показывает до 3 гигабит, сам интерфес всего 1 гигабит), а в "500 last values" сплошные нули.


    Если снимать статистику вручную, то 64битный счётчик никогда не переполняется.

    На скриншотах более подробно.

    В чем может быть трабл?

    Спасибо за внимание.
    Attached Files
  • mort
    Junior Member
    • Dec 2017
    • 19

    #2
    Идей нет, видимо

    Comment

    • mort
      Junior Member
      • Dec 2017
      • 19

      #3
      На 3.0.14 проблема сохраняется.

      Comment

      • Gabalino
        Senior Member
        • Mar 2013
        • 103

        #4
        Коммутатор Huawei CX915 - пики до 150Gbps, только у меня нет нулевых значений. Такой коммутатор у нас один, с остальными 2k хостов всё в порядке, грешу на кривую прошивку

        Zabbix 3.4.5

        Comment

        • pa1975
          Junior Member
          • Dec 2017
          • 14

          #5
          может бредовая идея, но ...
          - Проверить логи сервера - нет ли сообщений, что это хост по таймауту отключен?
          - очереди pollers не большие?
          - По скринам не сходится: в скрине настроек 35сек стоит, а в скрине истории - 5 сек данные....

          Comment

          • mort
            Junior Member
            • Dec 2017
            • 19

            #6
            Радиально на разных вендорах такое. Прошивка не при чем, если снимать значения вручную, то всё нормально. Проблема именно с заббиксом.

            Был баг репорт похожий был, на ветке 2 версии, там якобы починили...

            Comment

            • mort
              Junior Member
              • Dec 2017
              • 19

              #7
              Originally posted by pa1975
              может бредовая идея, но ...
              - Проверить логи сервера - нет ли сообщений, что это хост по таймауту отключен?
              - очереди pollers не большие?
              - По скринам не сходится: в скрине настроек 35сек стоит, а в скрине истории - 5 сек данные....
              Очереди небольшие, загрузка на уровне 5-40% по поллерам, хост от заббикса не отваливается, лог корректно отображает это.
              С таймаутом всё нормально, в Item настроен разный для разных промежутков времени.

              Comment

              • pa1975
                Junior Member
                • Dec 2017
                • 14

                #8
                Originally posted by mort
                • Проблема наблюдается только у пары устройств. На всех хостах в системе одинаковый oid snpmv2, используется ifHCInOctets и ifHCOutOctets.

                Если правильно понял:
                - устройств много..
                - проблема только у нескольких...
                - шаблон один на всех - и проблемные и непроблемные..

                Тогда надо убедиться что данные на сервер поступают.
                Самое простое (IMHO) - захватить трафик с фильтром по этим хостам:161, посмотреть, что запрашивается, что прилетает в ответ.
                И тогда уж либо сервер zabbix не получает от поллера данные, либо девайс не отдаёт.

                Comment

                • mort
                  Junior Member
                  • Dec 2017
                  • 19

                  #9
                  В общем, ситуация такая:
                  • С той же машины, где заббикс, скриптом раз 5 секунд запускаю snmpget - никаких нулей.
                  • Параллельно поставил mrtg - аналогично, всё нормально.

                  Получается виноват заббикс.

                  UPD: если увеличить время съёма счётчика до 30 или больше секунд, всё равно будут нули и провалы в графике, но, естественно, не с такой частотой.
                  Last edited by mort; 12-01-2018, 16:23. Reason: upd

                  Comment

                  • Semiadmin
                    Senior Member
                    • Oct 2014
                    • 1625

                    #10
                    Предположу, что функция Delta (speed per second) некорректно работает на малых интервалах обновления. Попробуйте или поставить 1 мин., или ради эксперимента собрать эту метрику As is.

                    Comment

                    • mort
                      Junior Member
                      • Dec 2017
                      • 19

                      #11
                      Originally posted by semiadmin
                      Предположу, что функция delta (speed per second) некорректно работает на малых интервалах обновления. Попробуйте или поставить 1 мин., или ради эксперимента собрать эту метрику as is.
                      Выше в upd написал об этом.

                      Comment

                      • yukra
                        Senior Member
                        • Apr 2013
                        • 1359

                        #12
                        Originally posted by mort
                        С той же машины, где заббикс, скриптом раз 5 секунд запускаю snmpget - никаких нулей.
                        Ага, потому что нули появляются в заббиксе после того, как он по вашей просьбе, пересчитает значение по формуле "(значение-пред_значение)/(время-пред_время)" где
                        значение - текущее значение
                        пред_значение - ранее полученное значение
                        время - текущий штамп времени
                        пред_время - штамп времени предыдущего значения
                        И где-то еще (не знаю до или после) умножит на ваш множитель.

                        На счет типа данных в соседней теме я тоже серьезно говорил, в документации прям так и написано:
                        Хранение значений:
                        Дельта (скорость в секунду)
                        ...
                        Обратите внимание: Так как результатом этого вычисления может быть число с плавающей точкой, рекомендуется использовать 'Тип информации' - Числовой (с плавающей точкой), даже если входящие значения целые положительные числа. Это особенно актуально для маленьких чисел где дробная часть имеет значение. Если числа с плавающей точкой очень большие и могут превысить длину поля в этом случае введенное значение может быть потеряно, в таком случае предлагается использовать тип Числовой (целое положительное) и это отбросит только дробную часть.
                        Плюс units желательно поменять с "bps" на "Bps".
                        Это я все вот на эту страницу ссылаюсь.

                        Originally posted by mort
                        Параллельно поставил mrtg - аналогично, всё нормально.
                        Надеюсь не про стандартный пятиминутный интервал говорите?

                        Comment

                        • wins
                          Senior Member
                          • Sep 2014
                          • 307

                          #13
                          Всем добрый вечер.
                          Не подтверждаю, ни одно утверждение. Все заббиксы с 3.0 по 3.4 - никаких проблем со съемом статы интерфейсов устройств. Интервалы 1,5,10 мин - ок.

                          Был один случай с ericsson se100, графики рвало с интервалами 1-2 ч. Оказался виноват конф железки.

                          Попробуйте стандартный тимплейт Template Module Interfaces SNMPv2. Очень годно написан. На нем так же плохо?

                          Comment

                          • mort
                            Junior Member
                            • Dec 2017
                            • 19

                            #14
                            Всем спасибо за ответы!

                            Я от 10 числа писал, там ещё ссылка на их баг-трекер, что проблема известная была. Видимо, как-то косяк перебрался в 3-ку.

                            Поставил из ветки 2.2 проблемы такой нет.

                            Про съём вручную snmpget, так я там рассчитывал дельту, разумеется, как это делает заббикс.

                            Comment

                            Working...