Ad Widget

Collapse

Данные не то собираются то нет.

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Zadralo23
    Member
    • Aug 2014
    • 34

    #1

    Данные не то собираются то нет.

    Подскажите в каком направлении копать.
    Есть сетевая железка. На нее применен стандартный шаблон с мониторингом интерфейсов. Правда портов на железке много (60).
    И вот время от времени не собираются данные по одному из интерфейсов.
    На Комплексном экране отображается скорость как Input так и Output. Так вот очень часто бывает так, что данные Input отображаются, а данные Output нет. Через некоторое время (25-30 мин) данные начинают снова собираться. И все это на одном экране. Захожу в Последние данные - данных нет. Иду в Администрирование - очередь. Очередь или пустая или там данные не относящиеся к данной железке. В логах сервера и прокси ничего криминального по данной железке нет. Да - вот еще. Данная железка подключена не напрямую к серверу, а через Zabbix Proxy. База Postgresql 9.4 и там и там. Zabbix - 2.4.6.
    Такое впечатление что данные где-то просто пропадают. Необходимо понять где именно они пропадают.
  • zmdpc
    Senior Member
    • Oct 2014
    • 484

    #2
    Предположу, что нужно убрать галку на "Использовать массовые запросы" (оно же "Use bulk requests") в настройке хоста...

    Comment

    • Zadralo23
      Member
      • Aug 2014
      • 34

      #3
      Originally posted by zmdpc
      Предположу, что нужно убрать галку на "Использовать массовые запросы" (оно же "use bulk requests") в настройке хоста...
      Спасибо. Попробую.

      Comment

      • yukra
        Senior Member
        • Apr 2013
        • 1359

        #4
        Если лаг в 20-30 минут, то я бы повесил триггер .nodata и в момент проблемы проверялся бы ручками - в железке проблема или в заббиксе. Можно черед действия

        Comment

        • Zadralo23
          Member
          • Aug 2014
          • 34

          #5
          Originally posted by yukra
          Если лаг в 20-30 минут, то я бы повесил триггер .nodata и в момент проблемы проверялся бы ручками - в железке проблема или в заббиксе. Можно черед действия
          Спасибо за совет, но немного не то. Как я уже писал данные собираются. Просто с одного интерфейса собирается входящий и исходящий трафик. И вот то один, исходящий прерывается, а входящий трафик продолжает показывать данные, то наоборот.
          Attached Files

          Comment

          • yukra
            Senior Member
            • Apr 2013
            • 1359

            #6
            Originally posted by zadralo23
            Спасибо за совет, но немного не то. Как я уже писал данные собираются. Просто с одного интерфейса собирается входящий и исходящий трафик. И вот то один, исходящий прерывается, а входящий трафик продолжает показывать данные, то наоборот.
            ну собственно тут 2 варианта: либо "железка лагает и перестает отдавать данные по входящей/исходящей скорости на интерфейсе", либо "данные теряются в заббиксе". Первый вариант как бы маловероятен, но я бы на первых парах отсек бы именно его (как наиболее простой в диагностике и наиболее сложный в починке).

            Второй вопрос: Администрирование - Общие - Прочие - Обновление неподдерживаемых элементов данных (в сек) - какое значение?

            Comment

            • Zadralo23
              Member
              • Aug 2014
              • 34

              #7
              Originally posted by yukra
              ну собственно тут 2 варианта: либо "железка лагает и перестает отдавать данные по входящей/исходящей скорости на интерфейсе", либо "данные теряются в заббиксе". Первый вариант как бы маловероятен, но я бы на первых парах отсек бы именно его (как наиболее простой в диагностике и наиболее сложный в починке).

              Второй вопрос: Администрирование - Общие - Прочие - Обновление неподдерживаемых элементов данных (в сек) - какое значение?
              Данный параметр имеет значение 600.

              Comment

              • zmdpc
                Senior Member
                • Oct 2014
                • 484

                #8
                Кстати какую битность при съеме параметров используете при опросе 32 или 64?

                Comment

                • Zadralo23
                  Member
                  • Aug 2014
                  • 34

                  #9
                  Originally posted by zmdpc
                  Кстати какую битность при съеме параметров используете при опросе 32 или 64?
                  А где посмотреть этот параметр.
                  Если это ОС - то они все 64 бит. Сервер Centos 6, Proxy Centos 7.

                  Изменение "Использовать массовые запросы" не помогло. График все равно остается рваным.

                  Comment

                  • zmdpc
                    Senior Member
                    • Oct 2014
                    • 484

                    #10
                    Покажите шаблон по которому снимаете данные

                    Comment

                    • Zadralo23
                      Member
                      • Aug 2014
                      • 34

                      #11
                      Originally posted by zmdpc
                      Покажите шаблон по которому снимаете данные
                      Я пытаюсь снять данные следующим шаблоном
                      Outgoing traffic on interface {#SNMPVALUE} ifOutOctets[{#SNMPVALUE}]
                      OID IF-MIB::ifOutOctets.{#SNMPINDEX}.

                      Так же попробую снять 64битные данные с OID IF-MIB::ifHCOutOctets.{#SNMPINDEX}. Вроде там такие данные есть.

                      Comment

                      • yukra
                        Senior Member
                        • Apr 2013
                        • 1359

                        #12
                        Originally posted by Zadralo23
                        А где посмотреть этот параметр.
                        Если это ОС - то они все 64 бит. Сервер Centos 6, Proxy Centos 7.

                        Изменение "Использовать массовые запросы" не помогло. График все равно остается рваным.
                        Code:
                        [root@zabbix ~]# /usr/bin/snmpwalk -v 2c -c LGL-MRTG 192.168.33.27 ifHCInOctets.5
                        IF-MIB::ifHCInOctets.5 = Counter64: 151559669540332
                        [root@zabbix ~]#
                        это 64 битный счетчик (ибо Counter64). Но это тут не причем. Ибо в случае 32 битного счетчика трафик бы полз вверх в район гигабира, а после 600-700 мбит резко падал бы до десятков мегабит.

                        Данный параметр имеет значение 600
                        Судя по примеру вашего графика он у вас 3 раза подряд перешел в статус "ансапортед". я бы посоветовал попробовать уменьшить этот параметр до 30-60 секунд (при условии что ансапортеды появляются у вас редко) и посмотреть "что будет"

                        Comment

                        • Zadralo23
                          Member
                          • Aug 2014
                          • 34

                          #13
                          Originally posted by yukra
                          Code:
                          [root@zabbix ~]# /usr/bin/snmpwalk -v 2c -c LGL-MRTG 192.168.33.27 ifHCInOctets.5
                          IF-MIB::ifHCInOctets.5 = Counter64: 151559669540332
                          [root@zabbix ~]#
                          это 64 битный счетчик (ибо Counter64). Но это тут не причем. Ибо в случае 32 битного счетчика трафик бы полз вверх в район гигабира, а после 600-700 мбит резко падал бы до десятков мегабит.

                          Судя по примеру вашего графика он у вас 3 раза подряд перешел в статус "ансапортед". я бы посоветовал попробовать уменьшить этот параметр до 30-60 секунд (при условии что ансапортеды появляются у вас редко) и посмотреть "что будет"
                          В данном форуме нашел что-то похожее

                          Сейчас настроил и начал собирать и 32 и 64 битные счетчики.
                          Посмотрим и протестируем.

                          Если не поможет, то попробуем поиграться с параметром
                          Обновление неподдерживаемых элементов данных (в сек).

                          Comment

                          • Zadralo23
                            Member
                            • Aug 2014
                            • 34

                            #14
                            Спасибо всем.
                            Решение - снимать данные не с 32 разрядных, а с 64 разрядных счетчиков.
                            почерпнутое здесь: https://www.zabbix.com/forum/showthread.php?t=40698
                            Так же помогло
                            убрать галку на "Использовать массовые запросы" (оно же "Use bulk requests") в настройке хоста...

                            Comment

                            Working...