Доброго времени суток!
Сегодня приключилась такая непонятка: на одном из серверов настроен мониторинг бесперебойника. Снятие показаний каждый 60сек. при отключении питания zabbix шлёт уведомление на почту и по sms. Получается что раз у минуту должно приходить уведомление со статусом бесперебойника (уровень зарядки батареи). Тесты прошли нормально, при отключении питания zabbix шлёт всё как задумано. Но вот нежданчиком отключают элетроэнергию, а от заббикса ничего нет. Бесперебойник садится, сервер отключается. После включения электропитания zabbix-сервер запускается и через какое-то время начинает слать уведомления:
[09:40:46] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
[09:43:00] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 90 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 90 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 88 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 88 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 83 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 83 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 79 %
[10:35:32] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 79 %
где-то в это время была произведена перенастройка элемента данных на проверку раз в 3 минуты
[10:37:46] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 77 %
[10:40:00] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 77 %
[10:42:15] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 75 %
[10:44:30] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 75 %
[10:46:44] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 73 %
[10:48:59] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 73 %
[10:51:13] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 68 %
[10:53:28] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 68 %
[10:55:43] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 62 %
[10:57:57] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 62 %
[11:00:12] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 60 %
[11:02:26] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 60 %
[11:04:41] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 58 %
[11:06:55] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 58 %
[11:09:10] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 53 %
[11:11:24] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 53 %
[11:13:39] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
[11:15:53] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
[11:18:08] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
[11:20:23] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
[11:22:38] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
[11:24:52] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
[11:27:06] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
[11:29:21] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
[11:30:33] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
[11:30:40] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 42 %
[11:31:51] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 42 %
[11:34:06] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:36:21] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:38:35] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:40:50] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:45:18] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:45:19] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
[11:47:33] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
[11:49:48] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
[11:52:02] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 24 %
[11:54:16] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 24 %
[11:56:31] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 26 %
[11:57:57] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 26 %
[11:58:05] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:12] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:19] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:27] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:34] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:41]
APC Smart UPS on Server116 STATUS: OK Last value: BOOST
[11:58:45]
APC Smart UPS on Server116 CHARGE for SMS: OK Last value: 17 %
[11:58:45]
Zabbix server has just been restarted: PROBLEM Last value: 00:01:40
[11:58:46]
Server116 has just been restarted: PROBLEM Last value: 00:02:48
[11:58:46]
Zabbix server has just been restarted: OK Last value: 00:11:39
[11:58:46]
Server116 has just been restarted: OK Last value: 00:12:48
причём по мере поступления уведомлений идёт зарядка бесперебойника (уровень заряда где-то 9-17%).
Такое впечатление, что у zabbix-а где-то накопилась учередь уведомлений и он её стал рассылать через какое-то время после загрузки сервера. И даже не высыпал всё разом, а технично продолжал слать с промежутками срабатывания проверки. А после исчерпания очереди высыпал разом что сервер, мол, перезапускался и статус бесперебойника ОК.
Сам триггер простецкий:
{Server116:apcups.bcharge1.last(0)}<99 & {Server116:apcups.status.str(BATT)}=1
2 значения нужно для того, чтобы если бесперебойник на батареях, то по мере разрядки сообщения посылались, а при питании от сети уже неважно какой у него уровень зарядки.
apcups.bcharge1 возвращает число типа 028.0
apcups.status возвращает текстовые строки типа ONLINE, ONBATT, BOOST, BOOST ONLINE
"Мониторинг->Последний данные" для элемента данных "APC Smart-UPS Battery Charge in % for SMS" по время этой "рассылки" показывал что всё нормально, apcups.status=ONLINE, apcups.bcharge1=ххх (шла зарядка батарей)
Подскажите, что смотреть, куда копать?
Сегодня приключилась такая непонятка: на одном из серверов настроен мониторинг бесперебойника. Снятие показаний каждый 60сек. при отключении питания zabbix шлёт уведомление на почту и по sms. Получается что раз у минуту должно приходить уведомление со статусом бесперебойника (уровень зарядки батареи). Тесты прошли нормально, при отключении питания zabbix шлёт всё как задумано. Но вот нежданчиком отключают элетроэнергию, а от заббикса ничего нет. Бесперебойник садится, сервер отключается. После включения электропитания zabbix-сервер запускается и через какое-то время начинает слать уведомления:
[09:40:46] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
[09:43:00] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 93 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 90 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 90 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 88 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 88 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 86 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 83 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 83 %
[10:33:29] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 79 %
[10:35:32] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 79 %
где-то в это время была произведена перенастройка элемента данных на проверку раз в 3 минуты
[10:37:46] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 77 %
[10:40:00] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 77 %
[10:42:15] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 75 %
[10:44:30] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 75 %
[10:46:44] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 73 %
[10:48:59] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 73 %
[10:51:13] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 68 %
[10:53:28] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 68 %
[10:55:43] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 62 %
[10:57:57] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 62 %
[11:00:12] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 60 %
[11:02:26] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 60 %
[11:04:41] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 58 %
[11:06:55] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 58 %
[11:09:10] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 53 %
[11:11:24] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 53 %
[11:13:39] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
[11:15:53] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
[11:18:08] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 51 %
[11:20:23] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
[11:22:38] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
[11:24:52] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 50 %
[11:27:06] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
[11:29:21] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
[11:30:33] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 43 %
[11:30:40] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 42 %
[11:31:51] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 42 %
[11:34:06] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:36:21] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:38:35] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:40:50] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:45:18] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 35 %
[11:45:19] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
[11:47:33] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
[11:49:48] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 30 %
[11:52:02] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 24 %
[11:54:16] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 24 %
[11:56:31] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 26 %
[11:57:57] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 26 %
[11:58:05] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:12] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:19] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:27] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:34] APC Smart UPS on Server116 CHARGE for SMS: PROBLEM Last value: 21 %
[11:58:41]
APC Smart UPS on Server116 STATUS: OK Last value: BOOST
[11:58:45]
APC Smart UPS on Server116 CHARGE for SMS: OK Last value: 17 %
[11:58:45]
Zabbix server has just been restarted: PROBLEM Last value: 00:01:40
[11:58:46]
Server116 has just been restarted: PROBLEM Last value: 00:02:48
[11:58:46]
Zabbix server has just been restarted: OK Last value: 00:11:39
[11:58:46]
Server116 has just been restarted: OK Last value: 00:12:48
причём по мере поступления уведомлений идёт зарядка бесперебойника (уровень заряда где-то 9-17%).
Такое впечатление, что у zabbix-а где-то накопилась учередь уведомлений и он её стал рассылать через какое-то время после загрузки сервера. И даже не высыпал всё разом, а технично продолжал слать с промежутками срабатывания проверки. А после исчерпания очереди высыпал разом что сервер, мол, перезапускался и статус бесперебойника ОК.
Сам триггер простецкий:
{Server116:apcups.bcharge1.last(0)}<99 & {Server116:apcups.status.str(BATT)}=1
2 значения нужно для того, чтобы если бесперебойник на батареях, то по мере разрядки сообщения посылались, а при питании от сети уже неважно какой у него уровень зарядки.
apcups.bcharge1 возвращает число типа 028.0
apcups.status возвращает текстовые строки типа ONLINE, ONBATT, BOOST, BOOST ONLINE
"Мониторинг->Последний данные" для элемента данных "APC Smart-UPS Battery Charge in % for SMS" по время этой "рассылки" показывал что всё нормально, apcups.status=ONLINE, apcups.bcharge1=ххх (шла зарядка батарей)
Подскажите, что смотреть, куда копать?
Comment