Zabbix теряет данные - прерывистый график

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Zabbix теряет данные - прерывистый график

    Zabbix 3.2
    Наблюдаю такую картину:

    Click image for larger version  Name:	Screenshot_6.png Views:	1 Size:	96.1 KB ID:	363111
    После активации хоста (галка enable в свойствах) данные некоторое время собираются, но потом график внезапно перестает показывать что-либо (no data).

    Используются дефолтные шаблоны SNMP Generic, Template SNMP Interfaces. У других хостов, подключенных к мониторингу по этим же шаблонам, таких проблем нет.
    По snmpget устройство без проблем отдает значения запрошенных OID. Пробовал и во время, когда заббикс успешно заполнял график данными, и в то время, когда переставал.
    На сетевом уровне проблем нет.
    При этом, по этому же устройству ICMP-данные льются непрерывно (и график ICMP ping не прерывается).

    zabbix_server.log ничего внятного не сообщил, вообще никаких ошибок (грепал по ip).

    Кто сталкивался с таким поведением и в какую сторону посоветуете копать?

  • neo32
    replied
    У нас была и остаётся такая проблема, как верно выше подметил Sadman(который к слову очень много раз меня в том числе выручал ответами ), трабла вероятнее всего в том что опрашиваемые ус-ва, не успевают давать ответ.
    У нас конкретно ситуация была связана с SNMP v3 зашифрованным трафиком, стоило сделать SNMP v2 сразу все работало отлично без прерываний. Видимо для APC'шек и некоторых Cisco шифрованные "бомбардировки" тяжелы, в моменты больших нагрузок на них.

    Leave a comment:


  • sadman
    replied
    видимо ваше устройство не переносит "бомбежку" запросами. оставьте на нем один snmp айтем, понаблюдайте...

    Leave a comment:


  • nameuser
    replied
    Выяснилось, что есть проблема с очередью и занятостью поллеров.
    А именно, по unreachable poller такая картина:

    Code:
    59820  -  S          0:00.08 zabbix_server: unreachable poller #1 [got 1 values in 60.024377 sec, getting values] (zabbix_server)
    59821  -  S          0:00.07 zabbix_server: unreachable poller #2 [got 1 values in 60.017725 sec, getting values] (zabbix_server)
    59822  -  S          0:00.07 zabbix_server: unreachable poller #3 [got 1 values in 60.030492 sec, getting values] (zabbix_server)
    59823  -  S          0:00.07 zabbix_server: unreachable poller #4 [got 1 values in 60.037693 sec, getting values] (zabbix_server)
    59824  -  S          0:00.08 zabbix_server: unreachable poller #5 [got 1 values in 60.026124 sec, getting values] (zabbix_server)
    59825  -  S          0:00.07 zabbix_server: unreachable poller #6 [got 1 values in 60.031375 sec, getting values] (zabbix_server)
    59826  -  S          0:00.07 zabbix_server: unreachable poller #7 [got 1 values in 60.020224 sec, getting values] (zabbix_server)
    59827  -  S          0:00.07 zabbix_server: unreachable poller #8 [got 1 values in 60.042507 sec, getting values] (zabbix_server)
    59828  -  S          0:00.07 zabbix_server: unreachable poller #9 [got 1 values in 30.032985 sec, getting values] (zabbix_server)
    59829  -  S          0:00.07 zabbix_server: unreachable poller #10 [got 1 values in 60.056713 sec, getting values] (zabbix_server)
    59830  -  S          0:00.08 zabbix_server: unreachable poller #11 [got 1 values in 60.032414 sec, getting values] (zabbix_server)
    59831  -  S          0:00.08 zabbix_server: unreachable poller #12 [got 1 values in 60.023053 sec, getting values] (zabbix_server)
    59832  -  S          0:00.07 zabbix_server: unreachable poller #13 [got 1 values in 30.031729 sec, getting values] (zabbix_server)
    59833  -  S          0:00.07 zabbix_server: unreachable poller #14 [got 1 values in 60.020181 sec, getting values] (zabbix_server)
    59834  -  S          0:00.07 zabbix_server: unreachable poller #15 [got 1 values in 60.019745 sec, getting values] (zabbix_server)
    59835  -  S          0:00.09 zabbix_server: unreachable poller #16 [got 1 values in 60.036854 sec, getting values] (zabbix_server)
    59836  -  S          0:00.07 zabbix_server: unreachable poller #17 [got 1 values in 60.009887 sec, getting values] (zabbix_server)
    59837  -  S          0:00.07 zabbix_server: unreachable poller #18 [got 1 values in 30.032550 sec, getting values] (zabbix_server)
    59838  -  S          0:00.08 zabbix_server: unreachable poller #19 [got 1 values in 60.025306 sec, getting values] (zabbix_server)
    59839  -  S          0:00.07 zabbix_server: unreachable poller #20 [got 1 values in 60.046480 sec, getting values] (zabbix_server)
    59840  -  S          0:00.07 zabbix_server: unreachable poller #21 [got 1 values in 60.017759 sec, getting values] (zabbix_server)
    59841  -  S          0:00.07 zabbix_server: unreachable poller #22 [got 1 values in 60.019027 sec, getting values] (zabbix_server)
    59842  -  S          0:00.07 zabbix_server: unreachable poller #23 [got 1 values in 60.019357 sec, getting values] (zabbix_server)
    59843  -  S          0:00.07 zabbix_server: unreachable poller #24 [got 1 values in 60.020289 sec, getting values] (zabbix_server)
    59844  -  S          0:00.07 zabbix_server: unreachable poller #25 [got 1 values in 60.021573 sec, getting values] (zabbix_server)
    59845  -  S          0:00.07 zabbix_server: unreachable poller #26 [got 1 values in 60.020360 sec, getting values] (zabbix_server)
    59846  -  S          0:00.06 zabbix_server: unreachable poller #27 [got 1 values in 60.022873 sec, getting values] (zabbix_server)
    59847  -  S          0:00.06 zabbix_server: unreachable poller #28 [got 1 values in 60.021895 sec, getting values] (zabbix_server)
    59848  -  S          0:00.06 zabbix_server: unreachable poller #29 [got 1 values in 60.021073 sec, getting values] (zabbix_server)
    59849  -  S          0:00.06 zabbix_server: unreachable poller #30 [got 1 values in 60.021237 sec, getting values] (zabbix_server)
    Должны ли unreachable poller быть такими медленными? 60 секунд!
    Какое бы количество unreachable poller я ни выставлял, через пару минут они все забиваются на 100%, изначально было 20 штук, пробовал 60 (ЦП позволяет), но проблема с занятостью осталась.
    Где может быть узкое место?
    Last edited by nameuser; 23-07-2018, 10:14.

    Leave a comment:


  • sadman
    replied
    Включить/выключить Bulk mode в свойствах узла пробовали?

    Leave a comment:


  • wins
    replied
    1. ручками поделать аналогичные запросы к устройству. посмотреть время отклика, посмотреть лог на железке.
    2. посмотреть все ли привинченые айтемы ок. если будет много неподдерживаемых айтемов, или "пустышек", забикс будет отрубать проверки к этому хосту.

    Leave a comment:


  • feathers
    replied
    устройство с которым такие проблемы (вендор, модель) уникально или в сети есть другие таки же которые исправно отдают данные?

    Leave a comment:

Announcement

Collapse
No announcement yet.
Working...
X