Доброго времени суток!
Поймал очень специфическую проблему: в сети есть несколько коммутаторов, данные с которых спокойно собираются по SNMP в течении одного-двух часов, после чего данные перестают собираться от слова "совсем" и исправить эту ситуацию может только перезагрузка Zabbix-сервера.
В логах:
При этом скрипт с snmpget, собирающий с данного коммутатора данные, продолжает работать и проблем с доступом не испытывают. ICMP до коммутатора ходит раз в 10 секунд(в целях теста), потерь пакетов нет, задержки нулевые.
Захват трафика tcpdump'ом никакой ясности не внёс. Запросы, отправляемые до и после возникновения проблемы, одинаковые, различается частота запросов к оборудованию.
Читал, что подобная проблема может возникать при использовании текстовых наименований OID'ов, но изначально все OID'ы в моих темплейтах были цифровыми.
Так-же находил совет на данном форуме - увеличить параметр Timeout в настройках Zabbix-сервера, что тоже не помогло.
Включение/отключение массовых запросов никакого эффекта не даёт.
Подскажите что можно попробовать для исправления ситуации.
Спасибо!
Zabbix 3.2.2 из репозитория repo.zabbix.com
OS: Ubuntu 16.04.1 LTS
Поймал очень специфическую проблему: в сети есть несколько коммутаторов, данные с которых спокойно собираются по SNMP в течении одного-двух часов, после чего данные перестают собираться от слова "совсем" и исправить эту ситуацию может только перезагрузка Zabbix-сервера.
В логах:
Code:
8496:20161229:145027.154 SNMP agent item ".3.6.1.2.1.47.1.1.1.1.7.1" on host "10.250.5.1" failed: first network error, wait for 15 seconds snmp_build: unknown failure snmp_build: unknown failure snmp_build: unknown failure 8500:20161229:144712.095 temporarily disabling SNMP agent checks on host "10.250.5.1": host unavailable 8489:20161229:144812.112 enabling SNMP agent checks on host "10.250.5.1": host became available snmp_build: unknown failure
Захват трафика tcpdump'ом никакой ясности не внёс. Запросы, отправляемые до и после возникновения проблемы, одинаковые, различается частота запросов к оборудованию.
Читал, что подобная проблема может возникать при использовании текстовых наименований OID'ов, но изначально все OID'ы в моих темплейтах были цифровыми.
Так-же находил совет на данном форуме - увеличить параметр Timeout в настройках Zabbix-сервера, что тоже не помогло.
Включение/отключение массовых запросов никакого эффекта не даёт.
Подскажите что можно попробовать для исправления ситуации.
Спасибо!
Zabbix 3.2.2 из репозитория repo.zabbix.com
OS: Ubuntu 16.04.1 LTS
Comment