Для тех, кто пробовал, отнюдь не секрет, что обработка SNMP-трапов в Zabbix реализована ужасно.
Причина: Zabbix не умеет принимать информацию о событиях извне, все события формируются в соотв. с его ограниченной внутренней логикой.
По этой причине нет никаких иных вариантов построить логику обработки SNMP-трапов, кроме триггерной логики.
Устройство же сообщает SNMP-трапом о проблеме и (как правило = 99% случаев) НЕ сообщает о "завершении" проблемы. Такая же беда и при анализе журнальных файлов: там есть события "произошла ошибка", но исключительно редко бывают события "ошибки больше нет, ликуйте!" - да ещё с каким-нибудь идентификатором ошибки желательно.
Из-за неестественной в таких случаях безальтернативной привязки к триггерной логике (полу)официальная документация Zabbix содержит вопиюще уродливый кусок текста про "самопереходящие в состояние OK триггеры на основе SNMP-traps'ов". То есть с точки зрения разработчиков Zabbix, совершенно нормально, когда переключающим триггерную логику событием является срабатывание примитивного "будильника" в виде функции nodata(период_времени). Сработал будильник - тут же триггер "ушёл" - проблема решена - и гори оно всё огнём!
Проще говоря, разработчики предлагают просто-напросто не мозолить глаза проблемой, если она имеет место в течение, например, 15-ти минут.
Очень глупый подход. И если бы представители "энтерпрайза" читали бы этот кусок документации Zabbix сразу, до принятия решения о выборе системы мониторинга - с вероятностью процентов 90 большинство из них отказались бы от такого счастья, потому что приём SNMP-трапов (напомню, что zabbix принимает их костыльным способом через 2 скрипта, сервер zabbix не умеет принимать трапы, хотя должен был бы... версия 3.2 как никак, не 0.0.3 уже) - это вообще ключевой функционал системы мониторинга.
Но речь немного не об этом. А о том, нет ли какого-либо внешнего веб-интерфейса, позволяющего работать с SNMP-трапами следующим образом:
1) Есть большая сортируемая и фильтруемая "портянка" трапов
2) В "портянке" отображаются хост-время-событие
3) Есть возможность "подтвердить" получение дежурным инженером информации о событии
4) У дежурного есть возможность "убрать" событие, нажав соотв. кнопку и подтвердив тем самым, что проблема решена
Очень жаль, что такой элементарной вещи нет в Zabbix
И крайне не хочется делать такое приложение самому.
Есть ли варианты?
Спасибо!
Причина: Zabbix не умеет принимать информацию о событиях извне, все события формируются в соотв. с его ограниченной внутренней логикой.
По этой причине нет никаких иных вариантов построить логику обработки SNMP-трапов, кроме триггерной логики.
Устройство же сообщает SNMP-трапом о проблеме и (как правило = 99% случаев) НЕ сообщает о "завершении" проблемы. Такая же беда и при анализе журнальных файлов: там есть события "произошла ошибка", но исключительно редко бывают события "ошибки больше нет, ликуйте!" - да ещё с каким-нибудь идентификатором ошибки желательно.
Из-за неестественной в таких случаях безальтернативной привязки к триггерной логике (полу)официальная документация Zabbix содержит вопиюще уродливый кусок текста про "самопереходящие в состояние OK триггеры на основе SNMP-traps'ов". То есть с точки зрения разработчиков Zabbix, совершенно нормально, когда переключающим триггерную логику событием является срабатывание примитивного "будильника" в виде функции nodata(период_времени). Сработал будильник - тут же триггер "ушёл" - проблема решена - и гори оно всё огнём!
Проще говоря, разработчики предлагают просто-напросто не мозолить глаза проблемой, если она имеет место в течение, например, 15-ти минут.
Очень глупый подход. И если бы представители "энтерпрайза" читали бы этот кусок документации Zabbix сразу, до принятия решения о выборе системы мониторинга - с вероятностью процентов 90 большинство из них отказались бы от такого счастья, потому что приём SNMP-трапов (напомню, что zabbix принимает их костыльным способом через 2 скрипта, сервер zabbix не умеет принимать трапы, хотя должен был бы... версия 3.2 как никак, не 0.0.3 уже) - это вообще ключевой функционал системы мониторинга.
Но речь немного не об этом. А о том, нет ли какого-либо внешнего веб-интерфейса, позволяющего работать с SNMP-трапами следующим образом:
1) Есть большая сортируемая и фильтруемая "портянка" трапов
2) В "портянке" отображаются хост-время-событие
3) Есть возможность "подтвердить" получение дежурным инженером информации о событии
4) У дежурного есть возможность "убрать" событие, нажав соотв. кнопку и подтвердив тем самым, что проблема решена
Очень жаль, что такой элементарной вещи нет в Zabbix
И крайне не хочется делать такое приложение самому.
Есть ли варианты?
Спасибо!
Comment