Ad Widget

Collapse

Как прекратить повторные уведомления если они не нужны?

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Victor Vislobokov
    Senior Member
    • Aug 2018
    • 298

    #1

    Как прекратить повторные уведомления если они не нужны?

    Ситуация.
    Есть некий веб-сервер, который поставлен на мониторинг в Zabbix. Кроме доступности находящегося на нём сайта, есть и другие проверки.
    Чтобы системный администратор не "проспал" уведомление в телеграмм, настроена повторная отправка уведомлений каждые 10 минут, если у триггера приоритет Disaster.
    Всё бы было хорошо, но вот программисты сломали сайт! Каждые 10 минут приходят уведомления об этом.
    Системный администратор знает, что проблема у программистов и таким образом, до починки сайта, ему совершенно не улыбается дёргаться каждые 10 минут при поступлении повторных сообщений в Телеграмм. Но что делать?

    Проблему нельзя закрыть, потому что она откроется снова на следующей проверке
    Проблему нельзя подтвердить, ибо уведомления будут продолжать поступать пока проблема не будет закрыта
    Деактивировать хост - не вариант, хочется продолжать получать прочие метрики и видеть прочие проблемы, если они вознинут. Более того, хотя хост деактивирован, уведомление о проблеме продолжат приходить, но уже в другом виде: "Problem: ..... NOTE: Escalation cancelled: host" Интересно какого собственно чорта?
    Деактивировать триггер, да вариант, но таких тригггеров будет несколько: доступность сайта, размер страницы, запущен ли httpd и т.д. - деактивировать каждый из них - неудобно!

    Хочется иметь волшебную кнопку: "остановить отправку уведомлений по данной проблеме"
    Как быть то?
  • Hamardaban
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • May 2019
    • 2713

    #2
    Вариант 1 - перевести хост в режим обслуживания
    Вариант 2 - использовать макрос в выражении триггера который бы влиял на срабатывание триггера когда он не нужен

    Comment

    • Semiadmin
      Senior Member
      • Oct 2014
      • 1625

      #3
      Originally posted by Victor Vislobokov
      Проблему нельзя закрыть, потому что она откроется снова на следующей проверке
      Это как раз решаемо изменением условия триггера.
      Problem: сначала было хорошо, а потом стало плохо
      Recovery: стало хорошо

      Comment

      • Victor Vislobokov
        Senior Member
        • Aug 2018
        • 298

        #4
        Originally posted by Semiadmin
        Это как раз решаемо изменением условия триггера.
        Problem: сначала было хорошо, а потом стало плохо
        Recovery: стало хорошо
        Не понял вас. Как решается то? Менять условие триггера каждый раз когда мне надо отключить уведомление? Не вариант. Триггер берётся как правило из шаблона, а шаблон прицеплен не только к проблемному хосту

        Comment

        • Victor Vislobokov
          Senior Member
          • Aug 2018
          • 298

          #5
          Originally posted by Hamardaban
          Вариант 1 - перевести хост в режим обслуживания
          Вариант 2 - использовать макрос в выражении триггера который бы влиял на срабатывание триггера когда он не нужен
          1. Не вариант. Во-первых, мне нужны другие проблемы на этом хосте. Во вторых, чтобы назначить обслуживание хосту надо далеко не одну кнопку нажать
          2. Т.е. к каждому условию КАЖДОГО триггера мне ещё и специальный макрос добавлять? Вы представляете себе объём работы?

          Comment

          • Semiadmin
            Senior Member
            • Oct 2014
            • 1625

            #6
            Originally posted by Victor Vislobokov
            Не понял вас. Как решается то? Менять условие триггера каждый раз когда мне надо отключить уведомление? Не вариант. Триггер берётся как правило из шаблона, а шаблон прицеплен не только к проблемному хосту
            Нет, написать условие один раз, но так, как нужно.

            Comment

            • Victor Vislobokov
              Senior Member
              • Aug 2018
              • 298

              #7
              Originally posted by Semiadmin

              Нет, написать условие один раз, но так, как нужно.
              Ну я не провидец к сожалению, чтобы заранее предвидеть, что мне станет нужно. Переписывать все условия у всех триггеров как-то не очень мне хочется.
              К тому же я убеждён, что Уведомления на страбатывание Триггера - это несколько разные сущности и управлять ими надо по-разному. Мне не нужно отключать триггер - он правильно срабатывает. Я хочу отключить уведомление конкретно от него. Но всё-равно спасибо за ответ.

              Comment

              • Semiadmin
                Senior Member
                • Oct 2014
                • 1625

                #8
                Зачем предвидеть, когда потребность уже есть?

                Ладно, объясню на примере. Предположим, есть веб-тест и триггер web.test.fail.last() > 0.
                Если разрешить ручное закрытие и закрыть проблему вручную, он, конечно, загорится снова.
                А можно написать тот же триггер так:
                Problem: web.test.fail.prev() = 0 and web.test.fail.last() > 0
                Recovery: web.test.fail.last() = 0

                Comment

                • Victor Vislobokov
                  Senior Member
                  • Aug 2018
                  • 298

                  #9
                  Спасибо. Мысль понял, для одного случая может оказаться решением, но все остальные триггеры перелопачивать...

                  Comment

                  • Semiadmin
                    Senior Member
                    • Oct 2014
                    • 1625

                    #10
                    Можно еще, наверно, поэкспериментировать с эскалациями. Скажем, оповещать о проблеме 1 раз, а непрерывное оповещение включать потом, если проблема не подтверждена.

                    Comment

                    • Victor Vislobokov
                      Senior Member
                      • Aug 2018
                      • 298

                      #11
                      Вот! Вот в это самое нужное место вы и попали! Огромное спасибо! Похоже это как раз то, что было нужно! Подтверждаю пробему и всё! Испытаю, посмотрим, но вроде бы это как раз ОНО!

                      Comment

                      Working...