Ad Widget

Collapse

Мониторинг свободного места на дисках.

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Sany_kz
    Junior Member
    • Oct 2024
    • 6

    #1

    Мониторинг свободного места на дисках.

    День добрый!
    Есть триггер
    last(/Windows by Zabbix agent/vfs.fs.dependent.size[{#FSNAME},pused],#3)>=90 and last(/Windows by Zabbix agent/vfs.fs.dependent.size[{#FSNAME},total])<{$TOTAL_LIMIT}
    который срабатывает если % занятого места на диске >=90% и общий объем диска менее 1tb
    Проблема в том, что триггер срабатывает 1 раз. И если вовремя не отреагировали, диск заполняется до 100%.
    Как можно дополнительно реализовать, что бы например триггер сработал, и если далее диск заполняется на 1гб триггера сработал еще раз? еще на 1гб - еще раз.
    Или может кто другой механизм подскажет?
  • Hamardaban
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • May 2019
    • 2713

    #2
    Скопируйте данный триггер, создайте на узле макросы с новыми порогами и укажите их в триггере.
    Потом поставьте один триггер в зависимость от другого. Суть в том что на каждое пороговое значение срабатывает триггер (возможно с большей важностью) а менее значимый "подавляется". И внимательно посмотрите на применяемый шаблон - возможно там уже есть нужные тригеры и остается только пороги поменять

    Last edited by Hamardaban; 23-01-2025, 13:52.

    Comment

    • Sany_kz
      Junior Member
      • Oct 2024
      • 6

      #3
      Originally posted by Hamardaban
      Скопируйте данный триггер, создайте на узле макросы с новыми порогами и укажите их в триггере.
      Потом поставьте один триггер в зависимость от другого. Суть в том что на каждое пороговое значение срабатывает триггер (возможно с большей важностью) а менее значимый "подавляется". И внимательно посмотрите на применяемый шаблон - возможно там уже есть нужные тригеры и остается только пороги поменять
      Т.е вы имеете ввиду создать N-нное количество триггеров на 1 элемент данных?
      Триггер А: занятое место>=90% (зависимость от Триггера B)
      Триггер B: занятое место>=91% (зависимость от Триггера С)
      Триггер C: занятое место>=92% (зависимость от Триггера D)
      и т.д

      Comment

      • Hamardaban
        Senior Member
        Zabbix Certified SpecialistZabbix Certified Professional
        • May 2019
        • 2713

        #4
        Да. Почему нет если оно вам надо так?

        Comment

        • IkarusKam
          Member
          • Dec 2023
          • 40

          #5
          Имеется такое предложение, чтобы не мучится с каждым созданием тригерром, мы сделаем проще -
          1. Мы зайдем в шаблон - Windows by Zabbix agent
          2.
          Макросы, добавим макрос на дополнительное значение процента -
          HTML Code:
          {$VFS.FS.PUSED.MAX.CRITW}
          Click image for larger version  Name:	image.png Views:	0 Size:	18.7 KB ID:	497812
          3. Заходи в Правила обнаружения - Mounted filesystem discovery - Прототипы триггеров - Клонируем любой из Триггеров и меняем значение переменной -
          Click image for larger version  Name:	image.png Views:	0 Size:	39.2 KB ID:	497813
          4. Чтобы изменения шаблона применились (По другому я не знаю как) - Заходим Узел сети на котором активирован данный шаблон и нажимаем Отсоединить и очистить и повторно подключаем Шаблон.

          И так вы можете повторить любое кол-во раз.
          Last edited by IkarusKam; 24-01-2025, 11:58.

          Comment

          • Diesel315
            Senior Member
            • Jan 2020
            • 159

            #6
            Originally posted by Sany_kz
            День добрый!
            Проблема в том, что триггер срабатывает 1 раз. И если вовремя не отреагировали, диск заполняется до 100%.
            Так если вы в первый раз не отреагировали, то чем вам помогут другие триггеры? Триггер, если сработал, он висит, пока вы не устраните проблему. Если вы хотите просто, чтобы вам еще раз напомнили, то настройте просто повторную рассылку уведомления, например через 1 час, если триггер не починили.

            Comment

            • Sany_kz
              Junior Member
              • Oct 2024
              • 6

              #7
              Originally posted by Diesel315

              Так если вы в первый раз не отреагировали, то чем вам помогут другие триггеры? Триггер, если сработал, он висит, пока вы не устраните проблему. Если вы хотите просто, чтобы вам еще раз напомнили, то настройте просто повторную рассылку уведомления, например через 1 час, если триггер не починили.
              Ситуации разные бывают. В 4 утра например триггер сработал. Пока все на работу пришли, в массиве сообщений проглядели и тд. Или сработал триггер на 95 %, ты думаешь у тебя есть время на реакцию, а диск заполнился за 10 мин?
              В общем, ситуаций куча разных бывает. Мы ведь тут не обсуждаем нужно-не нужно? Есть задача, попросил помощи в ее решении.
              Повторное уведомление тоже не подходит. Т.к это затронет и другие триггеры, а мне нужен именно этот. и он должен не просто повторно сработать, а именно на дальнейшее заполнение.

              Comment

              • Diesel315
                Senior Member
                • Jan 2020
                • 159

                #8
                Вы сами себе противоречите в своих словах. У вас триггер (95%) сработал в 4 утра, а диск заполнился как вы пишите за 10 минут. Дальше что?
                Вы сперва разберитесь со своим рабочим процессом, а потом костыли лепите, которые обьекивно являются костылями и граблями на которые вы наступаете. Я вам объясняю вашу ситуацию не с точки зрения поглумиться или поёрничать, а показываю минусы вашего рабочего процесса, который вы упорно не хотите видеть.
                в массиве сообщений проглядели
                Что значит прогладели? У вас дашборд должен висеть с активными триггерами! Я исключительно с благими намерениями хочу обратить ваше внимание на "нюансы" вашего подхода к вопросу.
                Ну если не хотите прислушится, то тогда извините, мешать не буду. Решение по клепанию 100500 триггеров на дальнейшее увеличение вам выше написали.
                Last edited by Diesel315; 28-01-2025, 05:50.

                Comment

                • Sany_kz
                  Junior Member
                  • Oct 2024
                  • 6

                  #9
                  Originally posted by Diesel315
                  Вы сами себе противоречите в своих словах. У вас триггер (95%) сработал в 4 утра, а диск заполнился как вы пишите за 10 минут. Дальше что?
                  Вы сперва разберитесь со своим рабочим процессом, а потом костыли лепите, которые обьекивно являются костылями и граблями на которые вы наступаете. Я вам объясняю вашу ситуацию не с точки зрения поглумиться или поёрничать, а показываю минусы вашего рабочего процесса, который вы упорно не хотите видеть.

                  Что значит прогладели? У вас дашборд должен висеть с активными триггерами! Я исключительно с благими намерениями хочу обратить ваше внимание на "нюансы" вашего подхода к вопросу.
                  Ну если не хотите прислушится, то тогда извините, мешать не буду. Решение по клепанию 100500 триггеров на дальнейшее увеличение вам выше написали.
                  Послушайте, я к вам тоже без каких либо претензий. Вместе с тем, у меня объем большой. Дашборд в который кто то будет сидеть смотреть - не влезет. Да и человека такого, смотрящего за 100-ей дашбордов не будет.
                  По поводу противоречий. С чего бы вдруг? Я описал 2 разных ситуации. Если в 4 утра забилось место на 95%, а через 10 мин на все 100% - дежурный инженер не будет ждать начала рабочего времени (со словами: протянем на 5% до утра), а на 2-3м триггере вызвонит ответственного. А если ты сидишь, в рабочее время, занятой и увидел триггер через мессендж - ты не сиюсекундно побежишь исправлять. Другое дело, если за ним последуют еще и еще триггеры-тут уже все бросишь и пойдешь исправлять.
                  Рабочий процесс, уж извините, выставлен тоже корректно (за исключением этого момента). Давайте не будем разводить не нужную полемику.

                  Ребятам выше - большое спасибо!
                  Last edited by Sany_kz; 28-01-2025, 09:05.

                  Comment


                  • IkarusKam
                    IkarusKam commented
                    Editing a comment
                    А решение выше вам не подходит?
                • Kos
                  Senior Member
                  Zabbix Certified SpecialistZabbix Certified Professional
                  • Aug 2015
                  • 3404

                  #10
                  Позволю себе, всё-таки, встрять.
                  Мне тоже не нравится сама постановка задачи (не заметили вовремя - сработать ещё раз... а не заметили на второй раз? на третий? и т.д.).
                  Но, если отвлечься от "нравится - не нравится", то по сути - у вас два варианта сделать именно то, о чём вы просите:
                  • рисовать дополнительные триггеры, срабатывающие по более критичным условиям - например, с более высококим пороговым значением, либо с более долгим анализом истории (типа, если минимальное значение за последние N минут всё ещё выше...). Этот вариант вам уже предложили и обсудили выше.
                  • использовать эскалации (ссылка) для отсылки повторных уведомлений об уже сработавших триггерах. Идея эскалаций - иметь возможность отсылать уведомления не только немедленно, но также и повторно в случае, если проблема долго не решается (причём, возможно, уже другому списку адресатов). Например, вы можете настроить себе отдельное действие только на нужные вам триггеры, которое будет, используя механизм эскалаций, долбать админов каждый час до тех пор, пока проблема не будет решена.
                  Ну, а уж что именно использовать и каким образом - это решать вам.

                  Comment

                  • Sany_kz
                    Junior Member
                    • Oct 2024
                    • 6

                    #11
                    Originally posted by Kos
                    Позволю себе, всё-таки, встрять.
                    Мне тоже не нравится сама постановка задачи (не заметили вовремя - сработать ещё раз... а не заметили на второй раз? на третий? и т.д.).
                    Но, если отвлечься от "нравится - не нравится", то по сути - у вас два варианта сделать именно то, о чём вы просите:
                    • рисовать дополнительные триггеры, срабатывающие по более критичным условиям - например, с более высококим пороговым значением, либо с более долгим анализом истории (типа, если минимальное значение за последние N минут всё ещё выше...). Этот вариант вам уже предложили и обсудили выше.
                    • использовать эскалации (ссылка) для отсылки повторных уведомлений об уже сработавших триггерах. Идея эскалаций - иметь возможность отсылать уведомления не только немедленно, но также и повторно в случае, если проблема долго не решается (причём, возможно, уже другому списку адресатов). Например, вы можете настроить себе отдельное действие только на нужные вам триггеры, которое будет, используя механизм эскалаций, долбать админов каждый час до тех пор, пока проблема не будет решена.
                    Ну, а уж что именно использовать и каким образом - это решать вам.
                    Разрешите всем еще 1 вопрос?
                    Как в оперативные данные получить значение 10%, если last(/.../vfs.fs.dependent.size[C:,free])>=90
                    Как в триггере получить переменную 100-last() и указать ее в оперативные данные?

                    Comment

                    • Kos
                      Senior Member
                      Zabbix Certified SpecialistZabbix Certified Professional
                      • Aug 2015
                      • 3404

                      #12
                      В оперативных данных можно указывать какие-то строковые константы и некоторые из системных макросов, самым полезным из которых является {ITEM.LASTVALUE}.
                      К сожалению, макросы выражений в этом месте не поддерживаются. Поэтому, если хотите, например, в условии триггера видеть количество занятого места, а в оперативных данных - оставшегося, то элемент данных для оставшегося места тоже нужно упомянуть в условии триггера (с каким-либо фиктивным условием, которое выполняется всегда, например, ">=0"), и тогда в оперативных данных можно ссылаться на его значение с помощью нумерованных макросов {ITEM.LASTVALUE<1-9>}.

                      Comment

                      Working...