Announcement

Collapse
No announcement yet.

Zabbix теряет данные - прерывистый график

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

    Zabbix теряет данные - прерывистый график

    Zabbix 3.2
    Наблюдаю такую картину:

    Click image for larger version  Name:	Screenshot_6.png Views:	1 Size:	96.1 KB ID:	363111
    После активации хоста (галка enable в свойствах) данные некоторое время собираются, но потом график внезапно перестает показывать что-либо (no data).

    Используются дефолтные шаблоны SNMP Generic, Template SNMP Interfaces. У других хостов, подключенных к мониторингу по этим же шаблонам, таких проблем нет.
    По snmpget устройство без проблем отдает значения запрошенных OID. Пробовал и во время, когда заббикс успешно заполнял график данными, и в то время, когда переставал.
    На сетевом уровне проблем нет.
    При этом, по этому же устройству ICMP-данные льются непрерывно (и график ICMP ping не прерывается).

    zabbix_server.log ничего внятного не сообщил, вообще никаких ошибок (грепал по ip).

    Кто сталкивался с таким поведением и в какую сторону посоветуете копать?

    #2
    устройство с которым такие проблемы (вендор, модель) уникально или в сети есть другие таки же которые исправно отдают данные?

    Comment


      #3
      1. ручками поделать аналогичные запросы к устройству. посмотреть время отклика, посмотреть лог на железке.
      2. посмотреть все ли привинченые айтемы ок. если будет много неподдерживаемых айтемов, или "пустышек", забикс будет отрубать проверки к этому хосту.

      Comment


        #4
        Включить/выключить Bulk mode в свойствах узла пробовали?

        Comment


          #5
          Выяснилось, что есть проблема с очередью и занятостью поллеров.
          А именно, по unreachable poller такая картина:

          Code:
          59820  -  S          0:00.08 zabbix_server: unreachable poller #1 [got 1 values in 60.024377 sec, getting values] (zabbix_server)
          59821  -  S          0:00.07 zabbix_server: unreachable poller #2 [got 1 values in 60.017725 sec, getting values] (zabbix_server)
          59822  -  S          0:00.07 zabbix_server: unreachable poller #3 [got 1 values in 60.030492 sec, getting values] (zabbix_server)
          59823  -  S          0:00.07 zabbix_server: unreachable poller #4 [got 1 values in 60.037693 sec, getting values] (zabbix_server)
          59824  -  S          0:00.08 zabbix_server: unreachable poller #5 [got 1 values in 60.026124 sec, getting values] (zabbix_server)
          59825  -  S          0:00.07 zabbix_server: unreachable poller #6 [got 1 values in 60.031375 sec, getting values] (zabbix_server)
          59826  -  S          0:00.07 zabbix_server: unreachable poller #7 [got 1 values in 60.020224 sec, getting values] (zabbix_server)
          59827  -  S          0:00.07 zabbix_server: unreachable poller #8 [got 1 values in 60.042507 sec, getting values] (zabbix_server)
          59828  -  S          0:00.07 zabbix_server: unreachable poller #9 [got 1 values in 30.032985 sec, getting values] (zabbix_server)
          59829  -  S          0:00.07 zabbix_server: unreachable poller #10 [got 1 values in 60.056713 sec, getting values] (zabbix_server)
          59830  -  S          0:00.08 zabbix_server: unreachable poller #11 [got 1 values in 60.032414 sec, getting values] (zabbix_server)
          59831  -  S          0:00.08 zabbix_server: unreachable poller #12 [got 1 values in 60.023053 sec, getting values] (zabbix_server)
          59832  -  S          0:00.07 zabbix_server: unreachable poller #13 [got 1 values in 30.031729 sec, getting values] (zabbix_server)
          59833  -  S          0:00.07 zabbix_server: unreachable poller #14 [got 1 values in 60.020181 sec, getting values] (zabbix_server)
          59834  -  S          0:00.07 zabbix_server: unreachable poller #15 [got 1 values in 60.019745 sec, getting values] (zabbix_server)
          59835  -  S          0:00.09 zabbix_server: unreachable poller #16 [got 1 values in 60.036854 sec, getting values] (zabbix_server)
          59836  -  S          0:00.07 zabbix_server: unreachable poller #17 [got 1 values in 60.009887 sec, getting values] (zabbix_server)
          59837  -  S          0:00.07 zabbix_server: unreachable poller #18 [got 1 values in 30.032550 sec, getting values] (zabbix_server)
          59838  -  S          0:00.08 zabbix_server: unreachable poller #19 [got 1 values in 60.025306 sec, getting values] (zabbix_server)
          59839  -  S          0:00.07 zabbix_server: unreachable poller #20 [got 1 values in 60.046480 sec, getting values] (zabbix_server)
          59840  -  S          0:00.07 zabbix_server: unreachable poller #21 [got 1 values in 60.017759 sec, getting values] (zabbix_server)
          59841  -  S          0:00.07 zabbix_server: unreachable poller #22 [got 1 values in 60.019027 sec, getting values] (zabbix_server)
          59842  -  S          0:00.07 zabbix_server: unreachable poller #23 [got 1 values in 60.019357 sec, getting values] (zabbix_server)
          59843  -  S          0:00.07 zabbix_server: unreachable poller #24 [got 1 values in 60.020289 sec, getting values] (zabbix_server)
          59844  -  S          0:00.07 zabbix_server: unreachable poller #25 [got 1 values in 60.021573 sec, getting values] (zabbix_server)
          59845  -  S          0:00.07 zabbix_server: unreachable poller #26 [got 1 values in 60.020360 sec, getting values] (zabbix_server)
          59846  -  S          0:00.06 zabbix_server: unreachable poller #27 [got 1 values in 60.022873 sec, getting values] (zabbix_server)
          59847  -  S          0:00.06 zabbix_server: unreachable poller #28 [got 1 values in 60.021895 sec, getting values] (zabbix_server)
          59848  -  S          0:00.06 zabbix_server: unreachable poller #29 [got 1 values in 60.021073 sec, getting values] (zabbix_server)
          59849  -  S          0:00.06 zabbix_server: unreachable poller #30 [got 1 values in 60.021237 sec, getting values] (zabbix_server)
          Должны ли unreachable poller быть такими медленными? 60 секунд!
          Какое бы количество unreachable poller я ни выставлял, через пару минут они все забиваются на 100%, изначально было 20 штук, пробовал 60 (ЦП позволяет), но проблема с занятостью осталась.
          Где может быть узкое место?
          Last edited by nameuser; 23-07-2018, 10:14.

          Comment


            #6
            видимо ваше устройство не переносит "бомбежку" запросами. оставьте на нем один snmp айтем, понаблюдайте...

            Comment


              #7
              У нас была и остаётся такая проблема, как верно выше подметил Sadman(который к слову очень много раз меня в том числе выручал ответами ), трабла вероятнее всего в том что опрашиваемые ус-ва, не успевают давать ответ.
              У нас конкретно ситуация была связана с SNMP v3 зашифрованным трафиком, стоило сделать SNMP v2 сразу все работало отлично без прерываний. Видимо для APC'шек и некоторых Cisco шифрованные "бомбардировки" тяжелы, в моменты больших нагрузок на них.

              Comment

              Ask questions to Zabbix Dev Team in person at the Zabbix Summit 2018!
              Working...
              X