Есть такая проблема: на некотором хосте висит два шаблона - пинговый и
SNMP-шный. В какой-то момент на хосте отваливается весь IP-стек, кроме ICMP. Соответственно, SNMP-шные проверки отваливаются по тайм-ауту и в логе сыпятся сообщения о сетевых ошибках:
Timeout while connecting to [192.168.130.38:161]
Host will be checked after 60 seconds
И ровно в то же время, что и последнее сообщение, все триггеры
пингового шаблона хоста переходят в состояние UNKNOWN. Далее, по приходу результата очередного пингования все эти триггеры переходят в
состояние OK (FALSE). И так далее, по кругу: UNKNOWN->OK->UNKNOWN->OK... Таким образом, триггеры хоста выходят на первые места в рейтинге Top-100 most busy triggers, что очень мешает.
Проверил очень просто - отвязал SNMP-шный шаблон от хоста, прыжки
триггеров прекращаются, показываются корректые данные, опять привязал - всё по новой.
Как правильно решать подобные проблемы? Я нашел несколько подобных постов форума|багов трекера, разных лет, но нигде не увидел решения.
Пример определения проблемного триггера пингового шаблона:
{template_ping
ing.sh[]. last( 0 ) }=100 (внешний скрипт пинга, возвращает процент потерь пакетов)
Zabbix-1.6.4 из портов FreeBSD.
SNMP-шный. В какой-то момент на хосте отваливается весь IP-стек, кроме ICMP. Соответственно, SNMP-шные проверки отваливаются по тайм-ауту и в логе сыпятся сообщения о сетевых ошибках:
Timeout while connecting to [192.168.130.38:161]
Host will be checked after 60 seconds
И ровно в то же время, что и последнее сообщение, все триггеры
пингового шаблона хоста переходят в состояние UNKNOWN. Далее, по приходу результата очередного пингования все эти триггеры переходят в
состояние OK (FALSE). И так далее, по кругу: UNKNOWN->OK->UNKNOWN->OK... Таким образом, триггеры хоста выходят на первые места в рейтинге Top-100 most busy triggers, что очень мешает.
Проверил очень просто - отвязал SNMP-шный шаблон от хоста, прыжки
триггеров прекращаются, показываются корректые данные, опять привязал - всё по новой.
Как правильно решать подобные проблемы? Я нашел несколько подобных постов форума|багов трекера, разных лет, но нигде не увидел решения.
Пример определения проблемного триггера пингового шаблона:
{template_ping
ing.sh[]. last( 0 ) }=100 (внешний скрипт пинга, возвращает процент потерь пакетов)Zabbix-1.6.4 из портов FreeBSD.
Comment