Ad Widget

Collapse

Иерархия аварий

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • demidtor
    Member
    • Feb 2020
    • 53

    #1

    Иерархия аварий

    Zabbix 4.0.13
    Добрый день. Есть вопрос о том, как выстроить иерархию проблем. Т.е. в наличии свич, в него воткнута периферия - ибп, арм, телефон. Когда свич отваливается, не хочется получать на панелях аварии всех устройств, ясно что проблема со свичом. Сделал два шаблона опроса, идет опрос доступности всех устройств по ICMP - первого и второго уровня иерархии. Сделал подавление срабатывания триггеров нижней иерархии с помощью "корреляции событий". Т.е. закрываю триггеры, если сработал триггер уровня выше. Но, получается в списке проблем (вкладка проблемы) потом каждый опрос-срабатывание триггера закрыт как "решено". Получается целая портянка. И момент аварии свича, все нижестоящие устройства в "карте сети" видны как работающие. Т.е. цель по сути просто не выводить аварии низкого уровня в панели (виджетах) просмотра статистики\аварий.
    Last edited by demidtor; 14-07-2021, 14:52.
  • Victor Vislobokov
    Senior Member
    • Aug 2018
    • 298

    #2
    Этот вопрос актуален не только у вас. К сожалению, в Zabbix почему-то не додумались до очевидного и простого добавления поля Parent (Родитель) к данным узла.
    Что касается способов решения вопроса, то все они мутные.

    Классически советуют использовать тэги. Т.е. например делаете так. чтобы при срабатывании триггера недоступности свича выставлялся триггером тэг скажем SWITCH_DOWN. Далее, добавляете свич и всё находящееся за ним оборудование в группу, затем настраиваете корелляцию, с условиями, что типа если группа узлов ваша и тэг старого события SWITCH_DOWN, закрыть новые события. При этом есть одно неудобство: поскольку Zabbix выполняет проверки асинхронно, то может получится так, что недоступность какого-то оборудования за свичом сработает раньше, чем сработает недоступность самого свича. В этом случае тэга SWITCH_DOWN не будет и данная корелляция не закроет проблему. Для этого надо было бы ещё одну корелляцию лепить, с условиями "если группа узлов старого события" - но такого условия в корелляциях почему-то нет Тем не менее, используя тэги можно таки извратится и сделать и корелляцию, которая закрывает события в этой же группе до SWITCH_DOWN, когда тот наконец сработает. Но мутно это всё - много труда, мало удовольствия.
    Last edited by Victor Vislobokov; 15-07-2021, 10:47.

    Comment

    • demidtor
      Member
      • Feb 2020
      • 53

      #3
      Originally posted by Victor Vislobokov
      Что касается способов решения вопроса, то все они мутные.

      Классически советуют использовать тэги.
      Спасибо. То что вы советуете, я сделал. Описал какие проблемы вылезли. Буду думать, может самому то либо накостылить.

      Comment

      • wins
        Senior Member
        • Sep 2014
        • 307

        #4
        Заметил добрую традицию: как только что-нибудь накостылишь - эта фича обязательно появится в следующей мажорной версии) Недавно костылил переодические отчеты, и вот.
        У себя разделяю группами хостов и как следствие - пользователями, правами, экшенами, дашбордами. Например "пользователькое барахло" (телефон), "аксесс" (коммутатор доступа), "агрегация" и так далее.

        Comment

        Working...