Ad Widget

Collapse

Zabbix Reboot

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • prostrelov
    Senior Member
    • May 2012
    • 115

    #1

    Zabbix Reboot

    Вопрос довольно банальный, но актуальный )
    Как правильно перегружать или выключать машину c zabbix server'ом
    так что бы не создавалась куча event'ов PROBLEM\OK из за не успевших ответить машин. Обычным reboot'ом или haltom даже если предварительно дать service zabbix_server stop после старта zabbix server'a создаётся оч. много бесполезных событий.

    Была мысль задать интервал в Maintenance. Но думаю должен быть способ проще.
  • Jimson
    Senior Member
    • Jan 2008
    • 1327

    #2
    м... в 1.8 возникало куча "unknown", это понятно, но откуда у тебя берутся "проблема" ?
    делай период "обслуживания" на пару минут, проще решения не найти

    Comment

    • Heilig
      Senior Member
      Zabbix Certified Trainer
      Zabbix Certified SpecialistZabbix Certified Professional
      • Mar 2013
      • 366

      #3
      Мне тоже кажеться что проблемма не том как Вы останавливаете zabbix сервер, а в том как часто опрашивате элементы данных и какие выражения используете в триггерах.

      Comment

      • prostrelov
        Senior Member
        • May 2012
        • 115

        #4
        тригеры на HOST IS DOWN
        {win:agent.ping.nodata(180)}=1 & {win:icmpping.nodata(120)}=1

        3 минуты + 2 минуты

        Comment

        • Jimson
          Senior Member
          • Jan 2008
          • 1327

          #5
          а чего вы ожидали от nodata() ?
          только через период обслуживания (со сбором данных) можно заблокировать срабатывания, и то период надо ставить с запасом, что бы и сервер загрузился и данные начали собираться

          Comment

          • prostrelov
            Senior Member
            • May 2012
            • 115

            #6
            То-есть nodata сверяет последний временной штамп полученного значения и текущее время ?

            Comment

            • Heilig
              Senior Member
              Zabbix Certified Trainer
              Zabbix Certified SpecialistZabbix Certified Professional
              • Mar 2013
              • 366

              #7
              Вот мое предположении (не могу на тесте создать вменяемую очередь и проверить).
              Вы остановили заббикс и у Вас начинает образовываться очередь. Через некоторое время Вы запустили и заббикс начинает разгребать очередь. За три минуты он не успел это сделать и перевел триггера HOST IS DOWN в статус "проблема"...

              В Вашей ситуации, я бы начал с настройки мониторинга и проверки загрузки процессов заббикс сервера (см. ссылку ниже), возможно Вам не хватает icmp поллеров или другие процессы сильно загружены.

              Вот тоже на эту тему.

              Какой интервал обновления у элементов данных agent.ping и icmpping.nodata?
              Как быстро заббикс разгребает очередь после старта?

              Comment

              • dima_dm
                Senior Member
                • Dec 2009
                • 2697

                #8
                Не совсем так
                С триггером
                тригеры на HOST IS DOWN
                {win:agent.ping.nodata(180)}=1 & {win:icmpping.nodata(120)}=1

                каждый триггер, который содержит «nodata»
                пересчитывается заббикс сервером каждых 30 секунд (по дефолту).
                Т.е. если сервер перезагружался (точнее не обновлял Item) >3 минут, и по всем триггерам c nodata, item-ы которых zabbix не успеет опросить за 30 секунд и время указанное как параметр nodata вышло (проверяется по наличию значений в базе за указанный интервал), будут сформированы алармы.
                Last edited by dima_dm; 25-04-2013, 16:34. Reason: пропустил слово item

                Comment

                • prostrelov
                  Senior Member
                  • May 2012
                  • 115

                  #9
                  очень интересно.
                  выходит nodata не самый лучший вариант в триггерах на доступность хостов.
                  будем использовать maintanace.

                  Heilig> спасибо за совет. пуллеров на icmp я ранее уже добавил, их около 20.
                  agent.ping 60
                  icmpping 60
                  Last edited by prostrelov; 26-04-2013, 09:45.

                  Comment

                  • dima_dm
                    Senior Member
                    • Dec 2009
                    • 2697

                    #10
                    Попробуйте так
                    {win:agent.ping.nodata(180)}=1 & {win:icmpping.max(#3)}=0
                    Должно лучше работать.

                    Comment

                    • Sergeylo
                      Member
                      • Feb 2011
                      • 40

                      #11
                      Не логичнее ли использовать в качестве основы триггера специфичные для item'а данные? Скажем, сумма n последних пингов. Равная нулю, совершенно точно даст срабатывание при неполадках и только при оных.
                      Вообще, nodata - довольно мутная штука, стоит кажде его использование обдумывать.

                      Comment

                      • Heilig
                        Senior Member
                        Zabbix Certified Trainer
                        Zabbix Certified SpecialistZabbix Certified Professional
                        • Mar 2013
                        • 366

                        #12
                        Я правильно понимаю, при добавлении "max(#3)}=0" у выражение, триггер из Вашего поста (Today 11:54) сработает не через 30 секунд, а через 3 минуты после старта Zabbix сервера (при условии что элемент данных icmpping уже более 3-х минут в очереди)? Или он вообще не сработает, так как последние полученные значения (при этом уже не актуальные, так как не работал zabbix сервер) для icmpping были "1"?
                        Last edited by Heilig; 26-04-2013, 14:01. Reason: добавил последнее предложение

                        Comment

                        • dima_dm
                          Senior Member
                          • Dec 2009
                          • 2697

                          #13
                          Originally posted by Heilig
                          Я правильно понимаю, при добавлении "max(#3)}=0" у выражение, триггер из Вашего поста (Today 11:54) сработает не через 30 секунд, а через 3 минуты после старта Zabbix сервера (при условии что элемент данных icmpping уже более 3-х минут в очереди)?
                          Нет.
                          max(#3) возьмёт 3 последних значения, неважно когда они были получены.
                          Т.е. если до выключения сервера значение icmpping было 1, то триггер сработает только после включения zabbix_server, если 3 раза icmpping вернёт 0, и сколько времени не поступали данные не важно.

                          Comment

                          Working...