Ad Widget

Collapse

Disover items & triggers

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • versh_va
    Junior Member
    • May 2017
    • 6

    #1

    Disover items & triggers

    Настраиваю мониторинг с помощью ipmitool, столкнулся с таким вопросом:

    Поскольку возможны сервера разной конфигурации, сделал дисковер сенсоров по их списку и далее получаются итемы вида ipmi.sensor.status[*] и ipmi.sensor.reading[*].
    И триггер для айтема вида "есди ipmi.sensor.status[*] не 'ok' - паниковать".

    Однако возник вопрос возможного флуда триггерами: в частности, датчики есть у каждой плашки памяти и в случае, например, отказа всего охлаждения с каждого сервера сработает порядка 20-30 триггеров, что очень печально и хотелось бы их минимизировать.

    Возможно ли поставить зависимость триггера вида "ipmi.sensor.status[*temp*]"? Чтобы мог сработать только один "температурный" триггер? Или даже что-то типа такой маски: "ipmi.sensor.status[*dimm*temp*]?

    Или может быть это можно реализовать в самом триггере каким-то образом?
  • plr
    Junior Member
    • May 2017
    • 21

    #2
    может быть через or в триггере перебрать все сенсоры?

    Comment

    • versh_va
      Junior Member
      • May 2017
      • 6

      #3
      Они не добавляются на новый хост вручную посенсорно, это а) шаблон, б) дискавер - все айтемы для триггеров появляются автоматически и могут быть разными от сервера к серверу. Поэтому перечислить их в лоб нельзя. Либо придется для кучи серверов вручную делать триггеры из набранных айтемов, что не очень хорошее решение.

      А вот с маской такой триггер возможен - если в триггерах вообще возможны маски...

      Comment

      • versh_va
        Junior Member
        • May 2017
        • 6

        #4
        Попробовал выделить температурные сенсоры в отдельный дискавер (с помощью регулярки вида .*temp.*) - увы, не прокатило, прототип триггера не может быть в зависимости от самого себя. То есть опять же нельзя сделать так, чтобы из пачки триггеров, созданных по прототипу, сработал только один...

        Comment

        • versh_va
          Junior Member
          • May 2017
          • 6

          #5
          можно ли сделать триггер, который будет смотреть статус множества других триггеров, полученных LLD?

          можно ли сделать каким-то образом триггер вида {T_ipmi_sensors:ipmisensor.status[.*].str(ok)}<>1
          ?

          Comment

          • Semiadmin
            Senior Member
            • Oct 2014
            • 1625

            #6
            Originally posted by versh_va
            можно ли сделать триггер, который будет смотреть статус множества других триггеров, полученных lld?

            можно ли сделать каким-то образом триггер вида {t_ipmi_sensors:ipmisensor.status[.*].str(ok)}<>1
            ?
            ИМХО, только при помощи запросов к БД, напрямую или через api

            Comment

            • versh_va
              Junior Member
              • May 2017
              • 6

              #7
              понятно...

              тогда еще проще наскриптить server health status, раз уж скриптом работает дискавер сенсоров и их чтение

              Comment

              • Semiadmin
                Senior Member
                • Oct 2014
                • 1625

                #8
                Originally posted by versh_va
                понятно...

                тогда еще проще наскриптить server health status, раз уж скриптом работает дискавер сенсоров и их чтение
                Только хорошо бы, чтобы продолжительность возможных проблем была больше интервала опроса, иначе может быть так, что server health status FAIL, а все отдельные сенсоры ОК, или наоборот - server health status ОК, а один из сенсоров FAIL.

                Comment

                Working...