Народ, поделитесь, плиз. Может и нет универсального решения, но хотя бы послушать других людей, кто как выходит из положения.
Для тех кто не в теме. Флаппинг - это многократная смена состояния триггера за короткое время. В других системах мониторинга, например в nagios, есть встроенная защита от флаппинга. В Zabbix'е такого нет (насколько мне известно).
Чем плох флаппинг? Допустим у нас есть хост, на котором в течении 5 минут (опрос каждую минуту) нагрузка (Load Average) изменяется от нормально до критичного значения и обратно несколько раз. В итоге мы имеем постоянно мигающий триггер в web-интерфейсе, оповещения (если они настроены) о возникновении проблемы и её закрытии. Как было бы логино (в первом приближении)? Если в течении одной минуты уровень LA прыгнул - зажёгся триггер, в следующую минуту уровень LA упал - триггер потух, в следующую минуту уровень LA прыгнул - считаем, что флаппинг, триггер не зажигаем, ждём ещё минуту, если уровень LA по прежнему высок - зажигаем триггер.
Для тех кто не в теме. Флаппинг - это многократная смена состояния триггера за короткое время. В других системах мониторинга, например в nagios, есть встроенная защита от флаппинга. В Zabbix'е такого нет (насколько мне известно).
Чем плох флаппинг? Допустим у нас есть хост, на котором в течении 5 минут (опрос каждую минуту) нагрузка (Load Average) изменяется от нормально до критичного значения и обратно несколько раз. В итоге мы имеем постоянно мигающий триггер в web-интерфейсе, оповещения (если они настроены) о возникновении проблемы и её закрытии. Как было бы логино (в первом приближении)? Если в течении одной минуты уровень LA прыгнул - зажёгся триггер, в следующую минуту уровень LA упал - триггер потух, в следующую минуту уровень LA прыгнул - считаем, что флаппинг, триггер не зажигаем, ждём ещё минуту, если уровень LA по прежнему высок - зажигаем триггер.
Comment