Ad Widget

Collapse

Проверка по нескольким данных для триггера SNMP STATIC DATA

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Eracer
    Junior Member
    • May 2021
    • 5

    #1

    Проверка по нескольким данных для триггера SNMP STATIC DATA

    Всем привет, прошу всех не равнодушных, знающих помочь разобраться в ситуации. Есть мониторинговое оборудование snmpcard, которое время от времени зависает, ладно бы данные не отдавало, но данные поступают в статике то есть графики рисуются ровными линиями. Мне больше ничего в голову не пришло как сделать триггер на проверку по трём данным с проверкой разницы в 10 часов. Но тут образовалась другая проблема что эти данные тоже время от времени совпадают. Кто что может подсказать, направить может по другому пути??? Спасибо.

    {Template Inelt UPS 10kVa:InputVoltage.avg(10m)}/{Template Inelt UPS 10kVa:InputVoltage.avg(10m,10h)}=1
    and
    {Template Inelt UPS 10kVa:OutputLoad.last(10m)}/{Template Inelt UPS 10kVa:OutputLoad.last(10m,10h)}=1
    and
    {Template Inelt UPS 10kVa:BattTime.avg(10m)}/{Template Inelt UPS 10kVa:BattTime.avg(10m,10h)}=1​
  • Hamardaban
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • May 2019
    • 2713

    #2
    С такими проблемами с оборудованием конечно не жизнь..
    К сожалению практически все системы управления ибп так или иначе кривые. Даже от «лидеров»
    Могу только посоветовать обратится к производителям - может есть более нормальная прошивка для карты?
    Ну и попробовать методом научного тыка понять почему виснет. Начните с включения/отключения массовых запросов, Потом может с версией snmp поиграться…

    Comment

    • Kos
      Senior Member
      Zabbix Certified SpecialistZabbix Certified Professional
      • Aug 2015
      • 3404

      #3
      Могу только подсказать, что, как минимум с версии 6.0, в Zabbix-е есть функция changecount() (ссылка) - возвращает количество изменений между соседними значениями в течение указанного периода. Это позволяет упростить вашу исходную триггерную формулу. Но, судя по используемому синтаксису, у вас версия более старая, нежели 5.4.

      Comment


      • Eracer
        Eracer commented
        Editing a comment
        Zabbix 5.0.2. © 2001–2020, Zabbix SIA
    • Kos
      Senior Member
      Zabbix Certified SpecialistZabbix Certified Professional
      • Aug 2015
      • 3404

      #4
      Zabbix 5.0.2. © 2001–2020, Zabbix SIA
      Ваше дело, конечно, но:
      • Zabbix v5.0.x больше не поддерживается с 31 мая 2023 года (ссылка), осталась лишь ограниченная поддержка (только критичные исправления и патчи, относящиеся к безопасности);
      • даже для версии 5.0 текущий релиз - 5.0.36, а не 5.0.2. Там исправлений, мягко говоря, вагон и маленькая тележка (читать тут - разделы "What's new" и тут - разделы "Upgrade notes"). Кстати, и по части SNMP там тоже было немало доработок, но это надо читать Release Notes (например, вот этот).

      Comment

      • Andrew Grekhov
        Member
        • Aug 2021
        • 45

        #5
        2 Eracer,​ а какая частота опроса? Все параметры одинакого часто опрашиваете.
        Попробуйте мониторить только один параметр.
        Внимательно OID на карту почитайте. Может окажется какой нибудь сигнал, который она воспримет как reset.

        Comment


        • Eracer
          Eracer commented
          Editing a comment
          Частота опроса у этих элементов 1 минута, пробовал по 1 параметру смотреть ,там получалось по 400-500 тригеров в сутки ОЧЕНЬ много для меня, по трём параметрам по 20 в сутки с разных узлов,про OID карту и reset не совсем понял?
      • Eracer
        Junior Member
        • May 2021
        • 5

        #6
        А может кто подскажет как на мой триггер под мою версию, добавить время задержки до 5 минут ожидания после сработки?

        Comment

        • Andrew Grekhov
          Member
          • Aug 2021
          • 45

          #7
          "Частота опроса у этих элементов 1 минута" смени на раз в 10минут.
          "пробовал по 1 параметру смотреть ,там получалось по 400-500 тригеров в сутки ОЧЕНЬ много для меня" не понял. Я про то, что попробуй мониторить только один параметр.
          Клоню мысль к тому, что там стоит слабый контроллер, который не позволяет часто опрашивать устройство. Надо подобрать оптимальную частоту, и ПОРЯДОК опроса.
          На ИБП у меня в зависимости от критичности 3 группы параметров с разной частотой опроса.
          Ещё поставь эксперимент, т.к. все важные параметры находятся в одной ветке сравни время выполнения:
          time snmpwalk -v2c -c $comunity...
          и
          time for a in U_in Uout
          do
          snmpget -v2c -c pummunity $IP $a
          done
          Поставь экперемент на сутки. Может оказаться,что вариант с snmpwalk работает без сбоев. Тогда делать через костыль:
          по cronу snmpwalk -> json-> zabbix_sent
          ---
          Про reset. Что делаете, когда определили, что контроллер отдаёт чушь? Как сбрасываете?
          В комплекте с контролером идёт MIB файл описание, там надо внимательно посмотреть OID'ы с правами readwrite.
          У свичей есть такой такой параметр, как обнуление arp-таблицы, может тут что то подобное попадётся.
          Хотя я бы просто вскрыл ИБП на предмет вспухших электролитов. У меня ни разу контроллеры не висли,
          поэтому "Странно это, странно это".​
          Last edited by Andrew Grekhov; 09-08-2023, 11:59.

          Comment


          • Eracer
            Eracer commented
            Editing a comment
            Частота опроса не ложит контроллер, проверено.Через json парсить не думаю что стоит нагружать cpu сервака этим,тем более что данные нормально отдаются в чистом виде, по поводу когда отдается чушь, мануально делаю ресет софтово.

          • Andrew Grekhov
            Andrew Grekhov commented
            Editing a comment
            "мануально делаю ресет софтово." Это как именно?
            Триггер на зависание контроллера (вместо его замены), и reset через curl.
            Hamardaban и Kos полезные вещи пишут, я бы прислушался.
        • Hamardaban
          Senior Member
          Zabbix Certified SpecialistZabbix Certified Professional
          • May 2019
          • 2713

          #8
          К стати еще один аргумент за переход на 6,4 версию - там появился ключик аналог snmpwalk и две предобработки для snmp.
          Направление развития такое: не дергать 10 параметров, а дернуть весь лист в одном запросе и распарсить по 10 зависимым элементам.
          По сути тоже самое что и Andrew Grekhov​ предложил.
          Для ряда железок которые плохо реагируют на частый множественный опрос и кривятся от bulk запросов - самое то!

          Comment


          • Eracer
            Eracer commented
            Editing a comment
            bulk запросы для слабых контроллеров отключаю сразу. но железки этого рода переваривают нормально.
        • Kos
          Senior Member
          Zabbix Certified SpecialistZabbix Certified Professional
          • Aug 2015
          • 3404

          #9
          Я так понимаю, что самый очевидный вариант - обновить свою версию до текущего релиза (5.0.2 -> 5.0.36) и посмотреть, есть ли разница, - вообще не рассматривается?

          Comment


          • Eracer
            Eracer commented
            Editing a comment
            Это конечно будет рано или поздно, у нас более 1000 разных хостов, и сейчас наскоком переводить не вариант, есть подводные камни типа шаблонов,предобработок,макросов и т.п которые потребуют переписания по новую версию забикса.

          • Kos
            Kos commented
            Editing a comment
            Поэтому я и предлагал не переводить наскоком на новую версию, а проапгрейдить нынешнюю версию до текущего релиза. Меняются лишь бинарники самого сервера, всё остальное не трогается.
        Working...