Добрый день!
Есть проблема с отработкой действий при срабатывании случайных триггеров, при чем от некоторых событий действия не срабатывают вовсе, на некоторые могут работать нормально, но при очередном срабатывании триггера действие не отработает. При том, что, например, действие на следующий сработанный триггер отработает.
Обновление до версии 5.4.8 не помогло(была версия 4.4).
В логах на момент срабатывания триггера ничего подозрительного не записывается.
При этом есть проблема, которая была еще до обновления, что после перезагрузки сервиса zabbix-server начинают приходить сообщения о проблемах со старыми датами {EVENT.DATE}. При перезагрузке так же могут прийти сообщения о срабатывании триггеров, на которые ранее действие не сработало.
Замечено, что все события, которые должны были быть отправлены, записываются в начале в таблицу escalations. При этом, что логично, в таблице alerts они не появляются.
У сервера запущено 20 процессов эскалации, при этом утилизация эскалатора постепенно возрастает со временем и держится на одном уровне, в данный момент – 50%.
Ниже приведу отрывок из ps -aux
escalator #1 [processed 0 escalations in 0.001047 sec, processing escalations]
escalator #2 [processed 0 escalations in 0.000968 sec, idle 3 sec]
Коллеги, в каком направлении смотреть? Есть подозрение, что за всё время обновлений(сервер, на сколько я знаю, обновляли с версии 2.0) «где-то что-то сломалось». Есть хосты, на которые действия вообще не работают, но начинают работать, если сделать клон хоста с другим именем.
Есть проблема с отработкой действий при срабатывании случайных триггеров, при чем от некоторых событий действия не срабатывают вовсе, на некоторые могут работать нормально, но при очередном срабатывании триггера действие не отработает. При том, что, например, действие на следующий сработанный триггер отработает.
Обновление до версии 5.4.8 не помогло(была версия 4.4).
В логах на момент срабатывания триггера ничего подозрительного не записывается.
При этом есть проблема, которая была еще до обновления, что после перезагрузки сервиса zabbix-server начинают приходить сообщения о проблемах со старыми датами {EVENT.DATE}. При перезагрузке так же могут прийти сообщения о срабатывании триггеров, на которые ранее действие не сработало.
Замечено, что все события, которые должны были быть отправлены, записываются в начале в таблицу escalations. При этом, что логично, в таблице alerts они не появляются.
У сервера запущено 20 процессов эскалации, при этом утилизация эскалатора постепенно возрастает со временем и держится на одном уровне, в данный момент – 50%.
Ниже приведу отрывок из ps -aux
escalator #1 [processed 0 escalations in 0.001047 sec, processing escalations]
escalator #2 [processed 0 escalations in 0.000968 sec, idle 3 sec]
Коллеги, в каком направлении смотреть? Есть подозрение, что за всё время обновлений(сервер, на сколько я знаю, обновляли с версии 2.0) «где-то что-то сломалось». Есть хосты, на которые действия вообще не работают, но начинают работать, если сделать клон хоста с другим именем.