Ad Widget

Collapse

Проблема с очередью уведомлений

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • angelsaint
    Junior Member
    • Jul 2011
    • 2

    #1

    Проблема с очередью уведомлений

    Доброго времени суток!

    Сегодня приключилась такая непонятка: на одном из серверов настроен мониторинг бесперебойника. Снятие показаний каждый 60сек. при отключении питания zabbix шлёт уведомление на почту и по sms. Получается что раз у минуту должно приходить уведомление со статусом бесперебойника (уровень зарядки батареи). Тесты прошли нормально, при отключении питания zabbix шлёт всё как задумано. Но вот нежданчиком отключают элетроэнергию, а от заббикса ничего нет. Бесперебойник садится, сервер отключается. После включения электропитания zabbix-сервер запускается и через какое-то время начинает слать уведомления:
    [09:40:46] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
    [09:43:00] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 90 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 90 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 88 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 88 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 83 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 83 %
    [10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 79 %
    [10:35:32] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 79 %

    где-то в это время была произведена перенастройка элемента данных на проверку раз в 3 минуты

    [10:37:46] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 77 %
    [10:40:00] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 77 %
    [10:42:15] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 75 %
    [10:44:30] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 75 %
    [10:46:44] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 73 %
    [10:48:59] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 73 %
    [10:51:13] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 68 %
    [10:53:28] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 68 %
    [10:55:43] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 62 %
    [10:57:57] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 62 %
    [11:00:12] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 60 %
    [11:02:26] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 60 %
    [11:04:41] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 58 %
    [11:06:55] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 58 %
    [11:09:10] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 53 %
    [11:11:24] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 53 %
    [11:13:39] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
    [11:15:53] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
    [11:18:08] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
    [11:20:23] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
    [11:22:38] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
    [11:24:52] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
    [11:27:06] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
    [11:29:21] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
    [11:30:33] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
    [11:30:40] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 42 %
    [11:31:51] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 42 %
    [11:34:06] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
    [11:36:21] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
    [11:38:35] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
    [11:40:50] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
    [11:45:18] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
    [11:45:19] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
    [11:47:33] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
    [11:49:48] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
    [11:52:02] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 24 %
    [11:54:16] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 24 %
    [11:56:31] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 26 %
    [11:57:57] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 26 %
    [11:58:05] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
    [11:58:12] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
    [11:58:19] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
    [11:58:27] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
    [11:58:34] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
    [11:58:41]
    APC Smart UPS on Server116 STATUS: OK Last value: BOOST
    [11:58:45]
    APC Smart UPS on Server116 CHARGE for SMS: OK Last value: 17 %
    [11:58:45]
    Zabbix server has just been restarted: PROBLEM Last value: 00:01:40
    [11:58:46]
    Server116 has just been restarted: PROBLEM Last value: 00:02:48
    [11:58:46]
    Zabbix server has just been restarted: OK Last value: 00:11:39
    [11:58:46]
    Server116 has just been restarted: OK Last value: 00:12:48
    причём по мере поступления уведомлений идёт зарядка бесперебойника (уровень заряда где-то 9-17%).
    Такое впечатление, что у zabbix-а где-то накопилась учередь уведомлений и он её стал рассылать через какое-то время после загрузки сервера. И даже не высыпал всё разом, а технично продолжал слать с промежутками срабатывания проверки. А после исчерпания очереди высыпал разом что сервер, мол, перезапускался и статус бесперебойника ОК.

    Сам триггер простецкий:
    {Server116:apcups.bcharge1.last(0)}<99 & {Server116:apcups.status.str(BATT)}=1

    2 значения нужно для того, чтобы если бесперебойник на батареях, то по мере разрядки сообщения посылались, а при питании от сети уже неважно какой у него уровень зарядки.

    apcups.bcharge1 возвращает число типа 028.0
    apcups.status возвращает текстовые строки типа ONLINE, ONBATT, BOOST, BOOST ONLINE

    "Мониторинг->Последний данные" для элемента данных "APC Smart-UPS Battery Charge in % for SMS" по время этой "рассылки" показывал что всё нормально, apcups.status=ONLINE, apcups.bcharge1=ххх (шла зарядка батарей)

    Подскажите, что смотреть, куда копать?
  • viconstg
    Junior Member
    • May 2011
    • 8

    #2
    А что в логе действий? (Administration -> Audit, Actions) Может, Заббикс вовремя посылал, а задержка связана с механизмом отправки сообщений (почтовый сервер, ...)?

    Comment

    • angelsaint
      Junior Member
      • Jul 2011
      • 2

      #3
      время отправки совпадало с тем, когда сообщения приходили (с учётом задержки в несколько сек.). К тому же уведомления приходят помимо почты через jabber и sms. В всё было отправлено в одно время. Доволно забавно получать sms с уведомлением что бесперебойник садится, видя как он перед глазами заряжается

      Comment

      Working...