Добрый день.
Описание проблемы:
1.На удаленной площадке происходит сбой и несколько хостов (6-7) перестают быть доступным, срабатывают триггеры
2.Происходит восстановление после сбоя, хосты доступны, триггеры переходят в статус ОК
3.Начинают срабатывать триггеры хаотично, статусы PROBLEM/ОК меняются каждые 1-2-5 минут.
Будут срабатывать до тех пор, пока не перезагрузишь сервер zabbix
В Latest data приходят корректные данные. Триггеры из шаблонов Windows, Cisco и простых проверок.
Zabbix 2.4, Zabbix Agent 2.4.1, Windows Server 2008
Элементы данных:
Template App Zabbix Agent: Agent ping
Триггер:
Zabbix agent on {HOST.NAME} is unreachable for 5 minutes
{Template OS Windows:agent.ping.nodata(5m)}=1
В логах есть следующее:
2440:20151023:103155.972 Zabbix agent item "agent.ping" on host "hostname" failed: first network error, wait for 15 seconds
2441:20151023:103215.687 Zabbix agent item "vm.memory.size[free]" on host "hostname" failed: another network error, wait for 15 seconds
2441:20151023:103236.716 Zabbix agent item "perf_counter[\234(_Total)\1402]" on host "hostname" failed: another network error, wait for 15 seconds
2441:20151023:103254.768 temporarily disabling Zabbix agent checks on host "hostname": host unavailable
2446:20151023:103314.398 cannot send list of active checks to [127.0.0.1]: host [Zabbix server] not found
2441:20151023:103354.886 enabling Zabbix agent checks on host "hostname": host became available
По такой ошибке нашел только http://huyabbix.com/zabbix-unreachable-hosts/
Описание проблемы:
1.На удаленной площадке происходит сбой и несколько хостов (6-7) перестают быть доступным, срабатывают триггеры
2.Происходит восстановление после сбоя, хосты доступны, триггеры переходят в статус ОК
3.Начинают срабатывать триггеры хаотично, статусы PROBLEM/ОК меняются каждые 1-2-5 минут.
Будут срабатывать до тех пор, пока не перезагрузишь сервер zabbix
В Latest data приходят корректные данные. Триггеры из шаблонов Windows, Cisco и простых проверок.
Zabbix 2.4, Zabbix Agent 2.4.1, Windows Server 2008
Элементы данных:
Template App Zabbix Agent: Agent ping
Триггер:
Zabbix agent on {HOST.NAME} is unreachable for 5 minutes
{Template OS Windows:agent.ping.nodata(5m)}=1
В логах есть следующее:
2440:20151023:103155.972 Zabbix agent item "agent.ping" on host "hostname" failed: first network error, wait for 15 seconds
2441:20151023:103215.687 Zabbix agent item "vm.memory.size[free]" on host "hostname" failed: another network error, wait for 15 seconds
2441:20151023:103236.716 Zabbix agent item "perf_counter[\234(_Total)\1402]" on host "hostname" failed: another network error, wait for 15 seconds
2441:20151023:103254.768 temporarily disabling Zabbix agent checks on host "hostname": host unavailable
2446:20151023:103314.398 cannot send list of active checks to [127.0.0.1]: host [Zabbix server] not found
2441:20151023:103354.886 enabling Zabbix agent checks on host "hostname": host became available
По такой ошибке нашел только http://huyabbix.com/zabbix-unreachable-hosts/
Comment