Ad Widget

Collapse

Пики на графиках сетевых интерфейсов в zabbix 2.2.1

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Br.Lumen
    Junior Member
    • Jan 2014
    • 12

    #1

    Пики на графиках сетевых интерфейсов в zabbix 2.2.1

    Всем привет!
    Схема следующая:

    Zabbix Server (2.2.1) <-- Zabbix Proxy (2.2.1 Активный) --> Zabbix Agent (2.2.1 Пассивный)

    Всё устанавливалось с нуля.
    Нагрузка на сервер:
    Количество узлов сети (под наблюдением/без наблюдения/шаблоны) 58 18 / 0 / 40
    Количество элементов данных (активных/деактивированых/не поддерживаются) 794 744 / 7 / 43
    Количество триггеров (активированных/деактивированных) [проблема/ок] 280 280 / 0 [1 / 279]
    Требуемое быстродействие сервера, новые значения в секунду 242.66

    Конфигурация сервера:
    ./configure --prefix=/etc/zabbix --enable-server --enable-agent --enable-ipv6 --with-mysql --with-net-snmp --with-libcurl --with-libxml2 --with-openipmi --with-ssh2

    Настройка сервера:
    StartIPMIPollers=1
    (Все остальные настройки по умолчанию)

    Конфигурация proxy:
    ./configure --prefix=/etc/zabbix --enable-proxy --enable-agent --enable-ipv6 --with-mysql --with-net-snmp --with-libcurl --with-libxml2 --with-openipmi --with-ssh2

    Настройки proxy:
    ProxyMode=0
    ProxyOfflineBuffer=24
    ConfigFrequency=60
    DataSenderFrequency=1
    (Все остальные настройки по умолчанию)

    Настройки агента по умолчанию.


    Интервал опроса сетевых интерфейсов установлен в 1 сек.
    Мониторим интерфейсы с помощью агента.
    Получаем следующий график:

    Click image for larger version

Name:	zabbix ?????? 1.jpg
Views:	1
Size:	71.4 KB
ID:	316752

    Физически интерфейс 100 Мбит/с
    От провайдера максимум 8 Мбит/с

    Предположительно пики возникают из за дублирования штампа времени в присылаемых данных. Вот пример:
    31-01-2014 09:55:12 1391136912 2011784
    31-01-2014 09:55:11 1391136911 3370256
    31-01-2014 09:55:10 1391136910 2290616
    31-01-2014 09:55:09 1391136909 2495736
    31-01-2014 09:55:08 1391136908 3054992
    31-01-2014 09:55:07 1391136907 162675240
    31-01-2014 09:55:07 1391136907 4529160

    31-01-2014 09:55:06 1391136906 680960
    31-01-2014 09:55:05 1391136905 2753016
    31-01-2014 09:55:04 1391136904 6601768


    Если собирать данные на прямую с хоста то такого эффекта не наблюдается.
    Остальные графики формируются нормально.

    Пробовал менять DataSenderFrequency в большую сторону - эффекта ноль.

    Есть мысли от чего дублируются показания и возникают пики?

    P.S.: На других версиях zabbix'а не проверял.
    P.P.S.: Есть похожая проблема https://www.zabbix.com/forum/showthr...ighlight=proxy
  • AllertGen
    Member
    • Dec 2013
    • 30

    #2
    Дублирование времени легко проверить. Достаточно поставить интервал опроса на раз в 2 или 3 секунды.

    Comment

    • Br.Lumen
      Junior Member
      • Jan 2014
      • 12

      #3
      Originally posted by allertgen
      Дублирование времени легко проверить. Достаточно поставить интервал опроса на раз в 2 или 3 секунды.
      Пока поставил интервал опроса 5 сек. Пиков нет.
      И всё таки от чего? Это баг? И почему только через прокси?

      Comment

      • Br.Lumen
        Junior Member
        • Jan 2014
        • 12

        #4
        Сегодня опять проскочил пик!
        Теперь при 5 сек. интервале опроса.
        [ATTACH]6637[/ATTACH]
        05-02-2014 14:54:21 1391586861 8205456
        05-02-2014 14:54:16 1391586856 8550008
        05-02-2014 14:54:11 1391586851 7448600
        05-02-2014 14:54:06 1391586846 7595848
        05-02-2014 14:54:01 1391586841 7310616
        05-02-2014 14:53:56 1391586836 8190472
        05-02-2014 14:53:51 1391586831 1983215432
        05-02-2014 14:53:51 1391586831 3805592

        05-02-2014 14:53:41 1391586821 8148192
        05-02-2014 14:53:36 1391586816 8157376
        05-02-2014 14:53:31 1391586811 7061384
        05-02-2014 14:53:25 1391586805 10252544
        05-02-2014 14:53:21 1391586801 8417928
        05-02-2014 14:53:16 1391586796 7575248
        05-02-2014 14:53:11 1391586791 7548744
        05-02-2014 14:53:06 1391586786 8090984
        05-02-2014 14:53:01 1391586781 8431224

        Comment

        • AllertGen
          Member
          • Dec 2013
          • 30

          #5
          А сколько таймаут стоит? Я вижу, что не хватает данных между строчками:
          05-02-2014 14:53:51 1391586831 3805592
          05-02-2014 14:53:41 1391586821 8148192

          Т.е. там должен был быть 1391586826, но его нет. Есть предположение, что он не получил вовремя ответ, а повторный опрос пришёлся на второй запрос, который ответил тут же. В результате - двойные данные. Правда это в теории, т.к. второго запроса быть не должно, т.к. следущий опрос не проходит до окончания первого.

          Comment

          • Br.Lumen
            Junior Member
            • Jan 2014
            • 12

            #6
            Originally posted by allertgen
            А сколько таймаут стоит? Я вижу, что не хватает данных между строчками:
            05-02-2014 14:53:51 1391586831 3805592
            05-02-2014 14:53:41 1391586821 8148192

            Т.е. там должен был быть 1391586826, но его нет. Есть предположение, что он не получил вовремя ответ, а повторный опрос пришёлся на второй запрос, который ответил тут же. В результате - двойные данные. Правда это в теории, т.к. второго запроса быть не должно, т.к. следущий опрос не проходит до окончания первого.
            Уточните пожалуйста о каком таймауте вы говорите?

            Comment

            • AllertGen
              Member
              • Dec 2013
              • 30

              #7
              В файле zabbix_server.conf параметр timeout.

              Comment

              • Br.Lumen
                Junior Member
                • Jan 2014
                • 12

                #8
                Originally posted by AllertGen
                В файле zabbix_server.conf параметр timeout.
                Default: 3 сек.

                Comment

                • AllertGen
                  Member
                  • Dec 2013
                  • 30

                  #9
                  Хм... Deafault обычно 15 сек, но видимо просто поменяли, а строчка выше осталась Главное, что бы было не закоментировано.
                  А значение параметра UnreachableDelay какое?

                  Comment

                  • Br.Lumen
                    Junior Member
                    • Jan 2014
                    • 12

                    #10
                    Originally posted by AllertGen
                    Хм... Deafault обычно 15 сек, но видимо просто поменяли, а строчка выше осталась Главное, что бы было не закоментировано.
                    А значение параметра UnreachableDelay какое?
                    # Default:
                    # UnreachableDelay=15

                    Comment

                    • AllertGen
                      Member
                      • Dec 2013
                      • 30

                      #11
                      Тогда итоговое время повторного опроса - 18 сек, что не сходится с Вашим - 10 сек. А лог остался за это время (когда был пик)?
                      И как дополнительный тест можно попробовать поставить timeout=2 и UnreachableDelay=1. Но тогда при нагруженном канале есть риск не получить данные + это может нагрузить poller сильнее.

                      Comment

                      • Br.Lumen
                        Junior Member
                        • Jan 2014
                        • 12

                        #12
                        Originally posted by AllertGen
                        Тогда итоговое время повторного опроса - 18 сек, что не сходится с Вашим - 10 сек. А лог остался за это время (когда был пик)?
                        И как дополнительный тест можно попробовать поставить timeout=2 и UnreachableDelay=1. Но тогда при нагруженном канале есть риск не получить данные + это может нагрузить poller сильнее.
                        zabbix_server.log

                        23405:20140205:145316.663 SNMP agent item "snmp.discovery" on host "gw-..." failed: first network error, wait for 15 seco
                        23409:20140205:145326.774 sending configuration data to proxy "zab-proxy-...", datalen 31815
                        23407:20140205:145331.749 resuming SNMP agent checks on host "gw-lev...": connection restored
                        23408:20140205:145344.974 sending configuration data to proxy "zab-proxy-...", datalen 36040
                        23410:20140205:145345.212 cannot send list of active checks to [192.168.0.53]: host [wiki] not found
                        23408:20140205:145356.207 cannot send list of active checks to [ip....]: host [bup-delta] not found
                        23409:20140205:145427.981 sending configuration data to proxy "zab-proxy-...", datalen 31815
                        23412:20140205:145446.778 sending configuration data to proxy "zab-proxy-...", datalen 36040

                        Всё что есть
                        Уровень лога тоже Default.

                        Comment

                        • AllertGen
                          Member
                          • Dec 2013
                          • 30

                          #13
                          Лично я, тогда, в тупике. Если только zabbix proxy и сам zabbix сервер не производят одновременный опрос хоста в одно и то же время...

                          Comment

                          • Br.Lumen
                            Junior Member
                            • Jan 2014
                            • 12

                            #14
                            Originally posted by AllertGen
                            Лично я, тогда, в тупике. Если только zabbix proxy и сам zabbix сервер не производят одновременный опрос хоста в одно и то же время...
                            Не могут. Хосты за прокси в настройках zabbix сервера с серыми ip. А в агентах за прокси указан серый ip прокси.

                            Сегодня ещё раз проскакивал пик. Нет ни какой взаимосвязи... в логах всё чисто. Видимо это баг...

                            Comment

                            • ugh
                              Senior Member
                              • Jun 2009
                              • 296

                              #15
                              А если сделать ProxyLocalBuffer=1 и посмотреть что копится в кэше прокси. Есть ли дублирование таймштампов?

                              По поводу корректности связки Сервер-Агент.
                              Вы точно проверяли на тех же самых параметрах интервала опроса итема, что и в варианте с прокси? И достаточно долго ждали чтобы однозначно говорить что пиков нет.

                              Не совсем уверен на какой стороне формируется таймштамп.
                              Если предположить, что по какой-то причине, ответ на запрос к агенту посланный в момент времени t2, пришел раньше чем ответ на запрос в посланный момент времени t1, то такая картина как у вас и будет.

                              А зачем такой суровый интервал опроса - 1 сек. Сильно подозреваю что если сделать например 30 секунд, то проблема уйдет.

                              Comment

                              Working...