Ad Widget

Collapse

Действие по тригеру.

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • hunter.vostok
    Member
    • Nov 2012
    • 39

    #1

    Действие по тригеру.

    Доброго времени суток. Есть гигабитный порт коммутатора. Snmp снимаем с с него его загрузку. Создан тригер - если загрузка становиться выше 920 Мбит/с - отсылается сообщение на почту. Данные снимаются с порта раз в 60 секунд. Ниже скриншоты тригера и действия.





    Получается такая ситуация - канал к вечеру упирается в полочку - и остается в таком положении часа 4-5. За это время ежеминутно на почту шлется письмо. За два выходных вышло 319 писем. Как можно сделать так чтобы приходило одно письмо когда мы перешли полочку в 920 Мбит/с и одно письмо когда вернулись? Заранее благодарен за помощь!
    Last edited by hunter.vostok; 08-03-2013, 19:42.
  • dima_dm
    Senior Member
    • Dec 2009
    • 2697

    #2
    написать триггер
    {Host:ifHCOutOctets.1.min(#4)}>92000000
    Чтобы срабатывало не по последнему значению, а по минимальному, например за 4 попытки.

    Comment

    • hunter.vostok
      Member
      • Nov 2012
      • 39

      #3
      Originally posted by dima_dm
      написать триггер
      {host:ifhcoutoctets.1.min(#4)}>92000000
      Чтобы срабатывало не по последнему значению, а по минимальному, например за 4 попытки.
      Не совсем понял. При таком синтаксисе он будет брать 4 последних значения, выбирать из них минимальное и по нему проверять сработку тригера?!..

      Если так - то не совсем то что нужно. Во первых это уменьшит в 4 раза количество сообщений (но не приведет его все равно к 2 штукам (начало и конец превышения)). А во вторых это на 4 минуты позже (а если уменьшать и дальше, то на больше количество минут) я узнаю о том что у меня есть проблемы.

      Может есть более изящное решение?

      Comment

      • fox-net
        Junior Member
        • Oct 2012
        • 28

        #4
        Originally posted by hunter.vostok
        Доброго времени суток. Есть гигабитный порт коммутатора. Snmp снимаем с с него его загрузку. Создан тригер - если загрузка становиться выше 920 Мбит/с - отсылается сообщение на почту. Данные снимаются с порта раз в 60 секунд. Ниже скриншоты тригера и действия.

        [ATTACH]5635[/ATTACH]

        [ATTACH]5636[/ATTACH]

        Получается такая ситуация - канал к вечеру упирается в полочку - и остается в таком положении часа 4-5. За это время ежеминутно на почту шлется письмо. За два выходных вышло 319 писем. Как можно сделать так чтобы приходило одно письмо когда мы перешли полочку в 920 Мбит/с и одно письмо когда вернулись? Заранее благодарен за помощь!
        Я так понимаю, проблема в том, что хоть лимит в 920 и достигнут, но после каждого измерения есть вполне реальная вероятность того, что значение будет ниже 920. Как только такое значение появляется, триггер переводится в режим ОК, естественно дальше опять при достижении лимита в 920 триггер опять сработает со всеми вытекающими. В данном случае надо брать среднее значение за какой-то период. Ведь предел в 920 может возникнуть в любой момент, это не 100Гб/с все-таки, 1Гб нагрузить может любой хост в одиночку. Если важно собирать все данные о переходе планки в 920, то по идее можно поиграться с зависимостями. Где триггер моментальный перестает срабатывать когда обнаруживается, что в течение 10 минут трафик превышает лимит. Это избавит от лишних сообщений, но позволит получать сообщения о моментальных перекрытиях лимита.

        Comment

        • hunter.vostok
          Member
          • Nov 2012
          • 39

          #5
          Originally posted by fox-net

          то по идее можно поиграться с зависимостями. Где триггер моментальный перестает срабатывать когда обнаруживается, что в течение 10 минут трафик превышает лимит. Это избавит от лишних сообщений, но позволит получать сообщения о моментальных перекрытиях лимита.
          Интересно! Подскажете где и что смотреть?

          Comment

          • fox-net
            Junior Member
            • Oct 2012
            • 28

            #6
            Originally posted by hunter.vostok
            Интересно! Подскажете где и что смотреть?
            Про зависимости написано тут: https://www.zabbix.com/documentation...s/dependencies

            Среднее значение можно брать либо калькулированием обычных ежеминутных значений, либо сбором уже усредненного значения. Например, для нового итема можно взять период не 60, а 300 секунд. В этом случае считываются данные каждые 5 минут и вычисляет среднее значение в секунду в течение этих 5-и минут. Для большей уверенности можно взять и большее значение.

            Comment

            • Navoyenok
              Senior Member
              • Dec 2011
              • 101

              #7
              Есть еще вариант.
              Использовать гистерезис.

              Как только обнаруживается превышение определенного значения (допустим в 920) "поднимается" аллерт, но в обратную сторону, чтобы аллерт был снят, необходимо, чтобы значение было менее (допустим) 800.

              Данный рецепт достаточно хорошо описан в литературе.

              P.S. А вообще это типичный пример "ложного" срабатывания с которым в разных системах мониторинга борятся по-разному. В заббиксе, например, можно использовать усреднения значений, гистерезис и т.д. Все дело в том, как написан сам триггер.

              С уважением, Navoyenok

              Comment

              • hunter.vostok
                Member
                • Nov 2012
                • 39

                #8
                Originally posted by navoyenok
                Есть еще вариант.
                Использовать гистерезис.

                Как только обнаруживается превышение определенного значения (допустим в 920) "поднимается" аллерт, но в обратную сторону, чтобы аллерт был снят, необходимо, чтобы значение было менее (допустим) 800.
                Почитал - все же не то - дело в том что как только график заходит за границу обозначенную тригером - я каждый интервал проверки буду получать сообщения - пока график не опуститься ниже. Я как раз и хочу уйти от этого. Мне нужно одно сообщение при уход за границу и все. Т.е. для следующих проверок чтобы было что-то типа - если я уже в алерте - то ничего не делать К примеру - пинг на сервер - раз в 30 секунд - сервер падает - приходит смс, через 30 секунд еще одно и так далее - пока ты что-то с сервером или забиксом не сделаешь Т.е. если тебе до серверной 10 минут - это 20 смс умноженное на количество человек которым рассылается - выходит грустно

                Comment

                • fox-net
                  Junior Member
                  • Oct 2012
                  • 28

                  #9
                  Originally posted by hunter.vostok
                  Почитал - все же не то - дело в том что как только график заходит за границу обозначенную тригером - я каждый интервал проверки буду получать сообщения - пока график не опуститься ниже. Я как раз и хочу уйти от этого. Мне нужно одно сообщение при уход за границу и все. Т.е. для следующих проверок чтобы было что-то типа - если я уже в алерте - то ничего не делать К примеру - пинг на сервер - раз в 30 секунд - сервер падает - приходит смс, через 30 секунд еще одно и так далее - пока ты что-то с сервером или забиксом не сделаешь Т.е. если тебе до серверной 10 минут - это 20 смс умноженное на количество человек которым рассылается - выходит грустно
                  Может у вас эскалация неверно настроена в триггере? Если триггер по логам срабатывает один раз при входе в порог и меняет в статус ОК после выхода из порога, а в этот момент вам много раз сыпятся сообщения, то скорее всего дело в эскалации.

                  Comment

                  • Navoyenok
                    Senior Member
                    • Dec 2011
                    • 101

                    #10
                    У Вас происходит эскалация сообщения.

                    Comment

                    • hunter.vostok
                      Member
                      • Nov 2012
                      • 39

                      #11
                      Originally posted by Navoyenok
                      У Вас происходит эскалация сообщения.
                      Перчитал кучу статей. Пробывал по всякому. Вот пример по которому делал:

                      Все равно он шлет сообщения не останавливаясь! Zabbix 1.8.11 - может просто у меня или весрия не та или еще чего - весь мозг себе уже сломал

                      Comment

                      • Navoyenok
                        Senior Member
                        • Dec 2011
                        • 101

                        #12
                        hunter.vostok, доброго времени суток.

                        Судя по картинкам, у Вас точно настроена эскалация. Предлагаю сделать следующее:
                        1. Чтобы "под раздачу" не попали другие виды сообщений (для которых реакция Вас устраивает) задать этому триггеру другой уровень опасности.
                        2. Создать новое оповещение, под которое попадет данный аллерт
                        3. Задать действие - отправить сообщение пользователю (или группе) и больше ничего не надо (т.е. в действиях д.б. одна строка).

                        С уважением, Navoyenok

                        Comment

                        • hunter.vostok
                          Member
                          • Nov 2012
                          • 39

                          #13
                          Originally posted by Navoyenok
                          hunter.vostok, доброго времени суток.

                          Судя по картинкам, у Вас точно настроена эскалация. Предлагаю сделать следующее:
                          1. Чтобы "под раздачу" не попали другие виды сообщений (для которых реакция Вас устраивает) задать этому триггеру другой уровень опасности.
                          2. Создать новое оповещение, под которое попадет данный аллерт
                          3. Задать действие - отправить сообщение пользователю (или группе) и больше ничего не надо (т.е. в действиях д.б. одна строка).

                          С уважением, Navoyenok
                          Так получилось - но мне пришлось в условиях действия указать два пункта - 1) Значение триггера = "ПРОБЛЕМА" и 2-й) Важность триггера = "Средняя". А вот если вместо второго я указываю Триггер = "testing test lost" то сообщения сыпятся подряд. У меня просто порядка 50 действий уже написано именно по второму сценарию Прийдеться видимо перевадить на важность тригеров и меньше исписанно будет и лучьше будет Спасибо большое за помощь.

                          Comment

                          • rekby
                            Member
                            • Jul 2010
                            • 91

                            #14
                            Операции

                            Я решил это на вкладке "Operations"
                            Задал длительность шага - сутки.
                            Теперь если проблема сохраняется - сообщение отправляется раз в сутки, т.е. напоминает о том что проблема есть с одной стороны и не мешается - с другой.

                            Comment

                            Working...