Ad Widget

Collapse

Странные события, после рестарта сервера

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • ManJak
    Member
    • Nov 2009
    • 42

    #1

    Странные события, после рестарта сервера

    OS: 7.2-STABLE FreeBSD

    zabbix-1.6.5,1 Application and network monitoring solution
    zabbix-agent-1.6.5,2 Application and network monitoring solution

    ZABBIX сервер запущен Да -
    Количество узлов сети (контролируется/не контролируется/шаблоны/удалено) 143 138 / 0 / 5
    Количество элементов данных (активных/неактивных/не поддерживается)[trapper] 2330 2309 / 21 / 0
    Количество триггеров (активированных/деактивированных)[истина/неизвестно/ложь] 1242 1235 / 7 [3 / 0 / 1232]
    Количество пользователей 9 3
    Требуемое быстродействие сервера, новые значения в секунду 16 -

    После рестарта Zabbix-сервера - некоторое количество (не смог понять, по каким причинам) событий заваливают окно "События" со статусом "ОК".

    Помогает, только глобальная чистка такого рода:
    UPDATE triggers SET value = DEFAULT WHERE triggerid IN (SELECT objectid FROM events WHERE eventid NOT IN (SELECT eventid FROM alerts));

    UPDATE triggers SET lastchange = DEFAULT WHERE triggerid IN (SELECT objectid FROM events WHERE eventid NOT IN (SELECT eventid FROM alerts));

    DELETE FROM events WHERE eventid NOT IN (SELECT eventid FROM alerts);

    DELETE FROM escalations WHERE eventid NOT IN (SELECT eventid FROM events);

    Теоретически, такого происходить не должно, т.к. триггеры не меняли своего состояния

    Учитывая количество триггеров - несложно сообразить, что это сильно напрягает. Хорошо, что хоть действия не срабатывают, нето меняб - распяли на медленном огне
  • ManJak
    Member
    • Nov 2009
    • 42

    #2
    После обновления до 1.6, вроде пока не наблюдается.

    Тема - закрыта, если не проявится снова.

    Нет, я рано радовался, иногда - возникает

    Теперь - при редактировании триггера, если его сохранить, то он сразу сообщает, что он ОК!
    Перегружать заббикса еще раз не пробовал, потом попробую, когда все спать лягут
    Last edited by ManJak; 09-11-2009, 16:34.

    Comment

    • ManJak
      Member
      • Nov 2009
      • 42

      #3
      Попробовал перезагрузить.

      Похоже, что все триггеры, кто попал в очередь - выдали статус ОК!
      Долго ждать не мог, т.к. мониторинг все-таки.

      Странно, что ни у кого такого не наблюдается, может кто-то хоть посоветует, где порыть можно.

      Версия - теперь последная из портов 1.6.6 (специально процвсапил и проапгрейдил).

      Comment

      • ManJak
        Member
        • Nov 2009
        • 42

        #4
        Способов борьбы с ЛОЖНЫМИ срабатываниями - найти не смог

        Более того - ложно срабатывало (после обновления до новой версии), то что перегружались девайсы, благо, что снова не отсылались (и не перегружались).

        Попробовал функцию "nodata", но тож самое было.

        Использовал триггеры:
        (({Template_Check_Alive:uptime.last(0)})<({Templat e_Check_Alive:uptime.prev(0)}))&({Template_Check_A live:uptime.nodata(1200)}=0)

        Т.е., как вынуть бред с вэб-морды - не знаю
        параметры нодаты-пробовал разные, но все-равно - пишет ОК, по каким-то своим нуждам.

        Я понимаю, что не шлет, но иногда - шлются СТРАННЫЕ SMS, когда и события - нет (при перезагрузке часто наблюдается, но и без нее хватает).

        Что я мог кривыми руками не так сделать?!
        Судя по всему (никто не сказал, что тож наблюдается), у меня это единственная трабла, но поймать-бы ее.

        Comment

        • ManJak
          Member
          • Nov 2009
          • 42

          #5
          Запостил в баг-репорт, т.к. бага серьезная:

          Comment

          • costas
            Senior Member
            • Aug 2009
            • 201

            #6
            Вообще это не бага, это нормальное явление после обновления триггера или добавления нового, если я правильно понял, то Вы получаете нотификации по этому поводу, значит у вас неправильно настроена нотификация.

            Нотификация может быть настроена на сработку как на положительный так и на отрицательный результат работы триггера, разумно предположить, что положительный результат Вам не нужен.
            Last edited by costas; 12-11-2009, 14:34.
            CentOS-5.5 i386, Zabbix 1.8.4 (stable), MySQL 5.0.92, PHP 5.2.17 (cli)

            ...эта проверка бесполезная, вредная, и она зло.

            Comment

            • costas
              Senior Member
              • Aug 2009
              • 201

              #7
              Originally posted by manjak
              Т.е., как вынуть бред с вэб-морды - не знаю
              параметры нодаты-пробовал разные, но все-равно - пишет ОК, по каким-то своим нуждам.
              Это не бред, это тригер обнаружил значение и соответственно среагировал на него, на выходе либо орицательный либо положительный результат, так и должно быть, иначе не будет нотификации о том что сервер поднялся например или сервис стал доступен, это правильная логика работы любой системы мониторинга.

              ЗЫ думаю на счёт баги Вы поторопились..
              CentOS-5.5 i386, Zabbix 1.8.4 (stable), MySQL 5.0.92, PHP 5.2.17 (cli)

              ...эта проверка бесполезная, вредная, и она зло.

              Comment

              • ManJak
                Member
                • Nov 2009
                • 42

                #8
                Не совсем, т.к.

                FALSE -> TRUE = Problem
                TRUE -> FALSE = OK
                UNKNOWN -> TRUE = Problem
                UNKNOWN -> FALSE = Ничего делать не надо (только засоряет логику)

                Вы попробуйте рестартануть сервак, где 1000 триггеров о_О
                Или обновить "шаблон-пинковалку" 150 свичей!

                Все, на события можно не смотреть, т.к. будет все заваленно ОК-ями!
                И в ентом хаосе будет не видно _РЕАЛЬНЫХ_ событий.

                Comment

                • costas
                  Senior Member
                  • Aug 2009
                  • 201

                  #9
                  Originally posted by ManJak
                  Не совсем, т.к.

                  FALSE -> TRUE = Problem
                  TRUE -> FALSE = OK
                  UNKNOWN -> TRUE = Problem
                  UNKNOWN -> FALSE = Ничего делать не надо (только засоряет логику)

                  Вы попробуйте рестартануть сервак, где 1000 триггеров о_О
                  Или обновить "шаблон-пинковалку" 150 свичей!

                  Все, на события можно не смотреть, т.к. будет все заваленно ОК-ями!
                  И в ентом хаосе будет не видно _РЕАЛЬНЫХ_ событий.
                  Увы мой друг, это проблема не zabbix-сервера, а его фронт-энд'а, на текущий момент навигация фронт-энд'а не позволяет делать каких то выборок и сортировок, и это не будет исправленно в текущей версии.

                  Смотреть в сторону версии 1.8 и ждать счастья..

                  ЗЫ как вариант Вы можете сами залесть в php-код фронт-энд'а и поправить на то что Вас больше устроит.
                  CentOS-5.5 i386, Zabbix 1.8.4 (stable), MySQL 5.0.92, PHP 5.2.17 (cli)

                  ...эта проверка бесполезная, вредная, и она зло.

                  Comment

                  • ManJak
                    Member
                    • Nov 2009
                    • 42

                    #10
                    Как фронт-энда, когда сервер создает записи в БД, которые не имеют смысла?

                    И если их удалить, то баги и нет.

                    Т.е., сервер не должен менять статус триггера, если не смог получить от него данные, а ранее получал. Unknown - это имеет смысл в самом начале.

                    Если уж хочется unknown-ов, то можно ввести временный статус (отдельное поле) и смотреть там, получил он их или нет.

                    Comment

                    Working...