Ad Widget

Collapse

Уведомления приходят косяками

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • viadmin
    Junior Member
    • Jan 2015
    • 7

    #1

    Уведомления приходят косяками

    Здравствуйте!

    Есть довольно серйозная проблема. Мы подняли новый сервер с базами данных и каждую ночь делаем бекап БД. В это время нагрузка на процессор возрастает до 95-100%.
    А в заббиксе есть триггер:
    {****erf_counter[\Processor(_Total)\% Processor Time,15].last(#10)}>90
    Когда он срабатывает, высылается письмо админам. Далле. В настройках уведомлений step duration выставлен на 3600 секунд, тоесть, я так понимаю, что если уведомление о триггере улетело, то следующее уведомление должно улететь не меньше чем через час. Но мне уведомления, почему-то, приходят каждую минуту. Уже и почтовый сервер матерится на каг-бы спам.
    От и проблема. Я не знаю, что сделать. Конфиги уже перелазил вдоль и впоперек, но так и ничего не нашел.
    Уважаемые знатоки! Посоветуйте, пожалуйста, хотябы, в каком направлении копать, а то уже действительно замучило каждое утро удалять по 50-70 писем.
  • rough-84
    Senior Member
    • Oct 2014
    • 198

    #2
    Скорее всего дело не в уведомлении, а именно в том, что тригер срабатывает N количество раз.
    Посмотрите по последним данным ночью. Если шкала то опускается то поднимается тем самым активируя триггер, то просто сделайте Гистерезис:
    Сделайте отключение триггера скажем пока не опустится ниже 50%

    Comment

    • aib
      Senior Member
      • Jan 2014
      • 1615

      #3
      Засомневался я, что вы правильно сконфигурировали триггер
      В описании сказано:
      Code:
      The function [B]last [/B]uses a different meaning for values 
      when prefixed with the hash mark - it makes it choose the n-th previous value, 
      so given the values 3, 7, 2, 6, 5 (from most recent to least recent), 
      last(#2) would return 7 and last(#5) would return 5.
      Следовательно, ваш триггер будет брать 10-е с конца значение и сравнивать его с 90.
      Вы уверены, что вам не нужна формула типа .min(#10) или .min(15m) ? (Если последние 10 значений(или за последние 15 минут) были больше 90 - оповестить)
      Sincerely yours,
      Aleksey

      Comment

      • Zentarim
        Senior Member
        • Mar 2012
        • 526

        #4
        Originally posted by viadmin
        Здравствуйте!

        Есть довольно серйозная проблема. Мы подняли новый сервер с базами данных и каждую ночь делаем бекап БД. В это время нагрузка на процессор возрастает до 95-100%.
        А в заббиксе есть триггер:
        {****erf_counter[\processor(_total)\% processor time,15].last(#10)}>90
        Когда он срабатывает, высылается письмо админам. Далле. В настройках уведомлений step duration выставлен на 3600 секунд, тоесть, я так понимаю, что если уведомление о триггере улетело, то следующее уведомление должно улететь не меньше чем через час. Но мне уведомления, почему-то, приходят каждую минуту. Уже и почтовый сервер матерится на каг-бы спам.
        От и проблема. Я не знаю, что сделать. Конфиги уже перелазил вдоль и впоперек, но так и ничего не нашел.
        Уважаемые знатоки! Посоветуйте, пожалуйста, хотябы, в каком направлении копать, а то уже действительно замучило каждое утро удалять по 50-70 писем.
        Скорее всего неверно использовано last(#10) Вам что-то типа max или svg надо использовать. Однако еще может быть и такое:
        Посмотрите, не стоит ли в свойствах триггера галочка
        "Многократная генерация событий ПРОБЛЕМА"

        Похоже на ее действие. Если стоит - снимите.
        Last edited by Zentarim; 28-01-2015, 21:16.

        Comment

        • viadmin
          Junior Member
          • Jan 2015
          • 7

          #5
          Спасибо, господа.

          Итого:
          1. Гистерезис не подошел - все те же косяки уведомлений )))
          2. Перечитал функции еще раз - действительно, last(#10) не подходит. Исправил на avg(#10). Посмотрим.
          3. Спасибо за совет про многократную генерацию событий, но галочка снята - когда пришли первые 40 писем за 3 минуты - сразу ее и проверил первым делом.

          Ну что ж, еще завтра-послезавтра отпишусь, скажу, что к чему.
          Спасибо большое.

          Comment

          Working...