Ситуация.
Есть некий веб-сервер, который поставлен на мониторинг в Zabbix. Кроме доступности находящегося на нём сайта, есть и другие проверки.
Чтобы системный администратор не "проспал" уведомление в телеграмм, настроена повторная отправка уведомлений каждые 10 минут, если у триггера приоритет Disaster.
Всё бы было хорошо, но вот программисты сломали сайт! Каждые 10 минут приходят уведомления об этом.
Системный администратор знает, что проблема у программистов и таким образом, до починки сайта, ему совершенно не улыбается дёргаться каждые 10 минут при поступлении повторных сообщений в Телеграмм. Но что делать?
Проблему нельзя закрыть, потому что она откроется снова на следующей проверке
Проблему нельзя подтвердить, ибо уведомления будут продолжать поступать пока проблема не будет закрыта
Деактивировать хост - не вариант, хочется продолжать получать прочие метрики и видеть прочие проблемы, если они вознинут. Более того, хотя хост деактивирован, уведомление о проблеме продолжат приходить, но уже в другом виде: "Problem: ..... NOTE: Escalation cancelled: host" Интересно какого собственно чорта?
Деактивировать триггер, да вариант, но таких тригггеров будет несколько: доступность сайта, размер страницы, запущен ли httpd и т.д. - деактивировать каждый из них - неудобно!
Хочется иметь волшебную кнопку: "остановить отправку уведомлений по данной проблеме"
Как быть то?
Есть некий веб-сервер, который поставлен на мониторинг в Zabbix. Кроме доступности находящегося на нём сайта, есть и другие проверки.
Чтобы системный администратор не "проспал" уведомление в телеграмм, настроена повторная отправка уведомлений каждые 10 минут, если у триггера приоритет Disaster.
Всё бы было хорошо, но вот программисты сломали сайт! Каждые 10 минут приходят уведомления об этом.
Системный администратор знает, что проблема у программистов и таким образом, до починки сайта, ему совершенно не улыбается дёргаться каждые 10 минут при поступлении повторных сообщений в Телеграмм. Но что делать?
Проблему нельзя закрыть, потому что она откроется снова на следующей проверке
Проблему нельзя подтвердить, ибо уведомления будут продолжать поступать пока проблема не будет закрыта
Деактивировать хост - не вариант, хочется продолжать получать прочие метрики и видеть прочие проблемы, если они вознинут. Более того, хотя хост деактивирован, уведомление о проблеме продолжат приходить, но уже в другом виде: "Problem: ..... NOTE: Escalation cancelled: host" Интересно какого собственно чорта?
Деактивировать триггер, да вариант, но таких тригггеров будет несколько: доступность сайта, размер страницы, запущен ли httpd и т.д. - деактивировать каждый из них - неудобно!
Хочется иметь волшебную кнопку: "остановить отправку уведомлений по данной проблеме"
Как быть то?
Comment