Ad Widget

Collapse

тригер на недоступность узла

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • sergo
    Member
    • Dec 2009
    • 99

    #1

    тригер на недоступность узла

    Добрый день имею ряд удаленных узлов VPS связь с которыми не очень стабильно, идут постоянные кратковременные разрывы незаметные для консоли ssh но при этом почемуто критичные для zabbix... смс утомляют посему решил сделать так, если хост недоступен присылать сообщение в джабер, если недоступен 3 минуты слать смс.
    пробовал различные варианты
    1) {HOSTNAME} Server is unreachable --- {BelarusianVDS:status.last(0)}=2
    {HOSTNAME} Server is unreachable 3 minute --- {BelarusianVDS:status.last(#6)}=2
    2) {HOSTNAME} Server is unreachable --- {BelarusianVDS:status.last(0)}=2
    {HOSTNAME} Server is unreachable 3 minute --- {BelarusianVDS:status.last(180)}=2

    не работает... оба сообщения приходят одновременно... при этом данные конструкции работают на любых других итемах (сеть, процесор память и т.п.) но на доступности не работают.... подскажите где именно я дурак и что делать?
  • dima_dm
    Senior Member
    • Dec 2009
    • 2697

    #2
    Советую не использовать ключ status, плохо он работает.
    Для серверов с Zabbix_agent я использую
    {Host:agent.ping.nodata(150)}=1
    Для всех остальных
    {Host:icmpping.max(90)}=0

    Comment

    • sergo
      Member
      • Dec 2009
      • 99

      #3
      Originally posted by dima_dm
      Советую не использовать ключ status, плохо он работает.
      Для серверов с zabbix_agent я использую
      {host:agent.ping.nodata(150)}=1
      Для всех остальных
      {host:icmpping.max(90)}=0
      спасибо так и поступлю...

      Comment

      • DEOVER
        Junior Member
        • Mar 2011
        • 11

        #4
        Originally posted by dima_dm
        Советую не использовать ключ status, плохо он работает.
        Для серверов с Zabbix_agent я использую
        {Host:agent.ping.nodata(150)}=1
        Для всех остальных
        {Host:icmpping.max(90)}=0
        Originally posted by sergo
        спасибо так и поступлю...
        Доброго дня уважаемые,
        А можно подробнее?!

        Вообще задача следующая:
        Доступность хоста
        Тайм аут 5 минут
        Далее срабатывание тригера.

        Я использую следующий тригер:
        {Host:status.last(0)}=2

        Но мне неужно чтоб тайм аут был 5 минут.

        Заранее благодарю!

        Comment

        • sergo
          Member
          • Dec 2009
          • 99

          #5
          Originally posted by DEOVER
          Доброго дня уважаемые,
          А можно подробнее?!

          Вообще задача следующая:
          Доступность хоста
          Тайм аут 5 минут
          Далее срабатывание тригера.

          Я использую следующий тригер:
          {Host:status.last(0)}=2

          Но мне неужно чтоб тайм аут был 5 минут.

          Заранее благодарю!
          В томто собственно и был нюанс, что если использовать конструкцию "статус" применимо к недоступности узла (в вашем случае {Host:status.last(300)}=2 или так {Host:status.last(#кол-во значений)}=2 ), она не работает (или не работает у меня конкретно не знаю)
          а так как подсказал dima_dm (т.е. опрос агента на пинг по недоступности данных на определенный отрезок времени, в вашем случае {Host:agent.ping.nodata(300)}=1) все работает корректно

          Comment

          • DEOVER
            Junior Member
            • Mar 2011
            • 11

            #6
            Спасибо за помощь. Буду пробовать! Удачи тебе!

            Слушайте, а подскажите плиз, ставлю триггер на службу:
            {Host:service_state[Service].min(120)}>0

            Но у меня не активируется, пишет:
            Evaluation failed for function: min

            Говоря просто, мне надо чтоб тайм аут был 3 минуты.
            Не получится ли использовать nodata(300)}=1 или какую переменную нужно использовать для корректности.

            Заранее большое человеческое спасибо!
            Last edited by DEOVER; 16-05-2011, 14:17.

            Comment

            • dima_dm
              Senior Member
              • Dec 2009
              • 2697

              #7
              Originally posted by DEOVER
              Слушайте, а подскажите плиз, ставлю триггер на службу:
              {Host:service_state[Service].min(120)}>0
              Правильно триггер написали, только 3 мин=180 сек
              {Host:service_state[Service].min(180)}>0
              Originally posted by DEOVER
              Но у меня не активируется, пишет:
              Evaluation failed for function: min
              Версия Zabbix какая?
              Last edited by dima_dm; 16-05-2011, 16:10.

              Comment

              • DEOVER
                Junior Member
                • Mar 2011
                • 11

                #8
                Originally posted by dima_dm
                Правильно триггер написали, только 3 мин=180 сек
                {Host:service_state[Service].min(180)}>0

                Версия Zabbix какая?
                Версия Zabbix 1.8.3

                Comment

                • dima_dm
                  Senior Member
                  • Dec 2009
                  • 2697

                  #9
                  Originally posted by deover
                  Версия zabbix 1.8.3
                  Все должно работать. Проверьте, что пробелов и русских букв в триггер не вставили.

                  Comment

                  • DEOVER
                    Junior Member
                    • Mar 2011
                    • 11

                    #10
                    Originally posted by dima_dm
                    Все должно работать. Проверьте, что пробелов и русских букв в триггер не вставили.
                    Дим, отказывается работать и все. Пробелов нет, кирилицы нет. Не знаю что делать уже. Выдает ошибку Evaluation failed for function: min и все. Есть еще варианты куда рыть?

                    Сейчас тестирую через переменную .last(180)}>0 посмотрим, потом отпишусь
                    Last edited by DEOVER; 18-05-2011, 06:35.

                    Comment

                    • dima_dm
                      Senior Member
                      • Dec 2009
                      • 2697

                      #11
                      На Zabbix 1.8.5 и Zabbix 1.8.3 проверил, никаких проблем нет, триггер добавляется.
                      Попробуйте взять Web интерфейс из исходных кодов Zabbix zabbix-1.8.X/frontends/php/, может быть у вас какой-нибудь модифицированный/повреждённый интерфейс стоит.

                      Comment

                      • DEOVER
                        Junior Member
                        • Mar 2011
                        • 11

                        #12
                        Originally posted by dima_dm
                        На zabbix 1.8.5 и zabbix 1.8.3 проверил, никаких проблем нет, триггер добавляется.
                        Попробуйте взять web интерфейс из исходных кодов zabbix zabbix-1.8.x/frontends/php/, может быть у вас какой-нибудь модифицированный/повреждённый интерфейс стоит.

                        Взяли, попробовали и итог прежний. Буду копать, что не так.. Спасибо Дим за помощь!

                        Comment

                        • dima_dm
                          Senior Member
                          • Dec 2009
                          • 2697

                          #13
                          Originally posted by DEOVER
                          Взяли, попробовали и итог прежний. Буду копать, что не так.. Спасибо Дим за помощь!
                          Может быть проблема в PHP модулях.
                          У меня стоят такие
                          php-gd
                          php-pear
                          php
                          php-bcmath
                          php-mysql
                          php-pdo
                          php-xml
                          php-mbstring
                          В некоторых сборках нужен ещё php-dom
                          Попробуйте поставить другую версию, проверьте, что все PHP модули одной версии и одного релиза, установлены все необходимые PHP модули.
                          Посмотрите логи Web сервера, может там какие ошибки есть.

                          Comment

                          • Dusty
                            Member
                            • Dec 2010
                            • 70

                            #14
                            Что бы не плодить треды

                            Версия 1.8.4 на mysql

                            Количество узлов сети под наблюдением - 139

                            Общее количество активных элементов - 11469

                            Требуемое быстродействие сервера, новые значения в секунду (малопонятный параметр) - 123.95

                            Основной метод наблюдения SNMP.

                            Триггер на недоступность организован следующим образом:

                            Добавлен элемент данных "NAME" (SNMPv1) - sysName.0 с периодом опроса 30"

                            Добавлен триггер "No Data" - {HOSTNAME:sysName.0.nodata(65)}=1

                            Т.е., если я всё правильно понял - если последние 2 (65") значения не получены, то триггер срабатывает.

                            До поры до времени всё это замечательно работало (таким образом наблюдение велось примерно на 20 хостах), конфигурация сети не менялась.

                            С определённого момента триггер начал срабатывать при каждом опросе хоста - то с проблемой, то с её снятием.

                            tcpdump показал, что значения приходят на сервак в полном объёме, снятие 500 последних значений элемента данных с вэб-морды показывает, что значения с некоторыми пробелами записаны (я так понимаю в базу).

                            Получается, что триггер не успевает считать значение из базы?

                            Куда смотреть?

                            Comment

                            • dima_dm
                              Senior Member
                              • Dec 2009
                              • 2697

                              #15
                              Originally posted by Dusty
                              Основной метод наблюдения SNMP.

                              Триггер на недоступность организован следующим образом:

                              Добавлен элемент данных "NAME" (SNMPv1) - sysName.0 с периодом опроса 30"

                              Добавлен триггер "No Data" - {HOSTNAME:sysName.0.nodata(65)}=1

                              Т.е., если я всё правильно понял - если последние 2 (65") значения не получены, то триггер срабатывает.

                              До поры до времени всё это замечательно работало (таким образом наблюдение велось примерно на 20 хостах), конфигурация сети не менялась.

                              Куда смотреть?
                              Я думаю, что Zabbix просто не успевает опрашивать устройства.
                              Если есть очередь Администрирование-> Очередь, нужно увеличивать количество Pollers.
                              /etc/zabbix/zabbix_server.conf
                              StartPollers
                              Посмотрите в последних данных по Item ровно ли 30 секунд, между опросами, есть ли пропуски более 65 секунд, это верный признак.
                              Решение: Увеличивать количество Pollers, увеличивать интервал наблюдения не 65 секунд, а например 120 и т.д.

                              Comment

                              Working...