Ad Widget

Collapse

Зависимости триггеров и тайминги

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • cosmobot
    Junior Member
    • Aug 2009
    • 14

    #1

    Зависимости триггеров и тайминги

    Подскажите как кто борется с лишними событиями ?

    Например сиутация как в документации:

    заббикс - роутер - интернет - роутер - хосты
    - интернет - роутер - хосты


    Проблемы при выходе из строя канала все хосты за ним генерируют анричибл .

    Пробовал бороться с этим добавля анричибл триггерам хостов зависимость от анричибл триггера роутера , но:


    1. Иногда триггеры хостов успевают сработать до триггера роутера.
    2. Иногда триггеры хостов срабатывают на излете . Тобишь канал восстановился триггер роутера возвратилсяв норму и тут посыпались события от анричибл триггеров хостов.
    3. Извращенные враианты. Когда триггер хоста попадает в противофазу и хост висит в анричибл (при этом успешно передвая свежие данные ).


    Кто как с этим борется ?

    Буду рад любым советам и мнениям:-)
  • oalex
    Member
    • Jul 2009
    • 86

    #2
    почти тот же самый вопрос

    Comment

    • cosmobot
      Junior Member
      • Aug 2009
      • 14

      #3
      Все это весьма печально.


      Непонятно как экспулатировать заббикс в любой распредленной сети.
      Last edited by cosmobot; 05-05-2012, 07:19.

      Comment

      • cosmobot
        Junior Member
        • Aug 2009
        • 14

        #4
        Поправил анричибл триггеры хостов. Теперь они реагируют на nodata . Добавил анричибл триггеру роутера гистерезис (что бы поднимался с задержкой и тригерры хостов успевали прийти в норму)

        Но проблема сохранилась.... На дашбоарде срабатывания тригеров хостов нет а уведомления всеравно приходят.


        Как вообще можно использовать заббикс ?

        Причем тема trigger dependencies довольно популярна на форуме. Но никакого решения я так и не увидел .....
        Last edited by cosmobot; 06-05-2012, 11:20.

        Comment

        • SergeyAB
          Junior Member
          • May 2012
          • 9

          #5
          Как вариант можно создать триггер "host is down for 1 min" с уровнем тревоги "инфомация" или "средний". Затем сделать триггер "host is down for 2 min" с приоритетом повыше и на него уже цеплять все прочие зависимости. Шанс ложных срабатываний меньше.

          Comment

          • cosmobot
            Junior Member
            • Aug 2009
            • 14

            #6
            Можно навреное и так.

            На текущий момент я тестирую вот такое решение:


            1. поменял выражения для анричибл тригров ( где тот тут на форуме народ советовал)

            для агентов : agent.ping.nodata(120)}=1
            для остальных: icmpping.max(90)}<1

            Сразу стало меньше глюков с опредлением статуса агентов.

            2. Настроил отложенные уведомления как тут:


            Пока вроде работает. Не очень радуют задержки но ничего лучшего пока не нашел\придумал.

            Comment

            • cosmobot
              Junior Member
              • Aug 2009
              • 14

              #7
              Выявился первый косяк.
              Множественные сообщения о переходе триггера в ok .

              Comment

              • cosmobot
                Junior Member
                • Aug 2009
                • 14

                #8
                В общем и целом описанный выше метод работает нормально.
                Но в случае если канал пропадет на сразу а деградирует так что пинги проходят а tcp уж нет ложные срабатывания все равно появляются.

                Comment

                Working...