Есть zabbix-сервер, для него через web-интерфейс уже настроены несколько узлов сети, на каждом узле - по несколько элементов данных с типом "Zabbix агент", т.е. элементы данных собираются в пассивном режиме, с определенной периодичностью на основе запросов от сервера к хостам с установленным на них агентом. Данные собираются корректно.
Возникла необходимость на одном из таких хостов получать дополнительные данные путем вызова утилиты zabbix_sender.
Через web-интерфейс zabbix-а был настроен новый элемент данных с типом "Zabbix траппер". Если на машине, с которой требуется отправка этих данных, запустить утилиту zabbix_sender (zabbix_sender.exe -z <адрес сервера> -s <имя узла сети> -p <порт сервера> -k <ключ элемента данных> -o <значение элемента данных> -vv) - она отрабатывает только в то время, когда не выполняются ранее настроенные пассивные проверки от сервера к агенту.
Если же запустить sender в момент такой проверки - возвращается ошибка Connection timeout occured, после завершения проверки - sender снова отрабатывает, данные передаются на сервер корректно (их можно просмотреть через web-интерфейс zabbix-сервера, данные обновляются).
Полный текст ошибки, возвращаемой sender-ом в момент запуска пассивных проверок сервера к агенту: zabbix_sender.exe [6988]: DEBUG: send value error: cannot connect to [[X.X.X.X]:10051]: A connection timeout occurred. Sending failed.
По данному вопросу уже проведена большая аналитическая работа (подробности можно посмотреть в http://stackoverflow.com/questions/4...o-not-work-sim), но, к сожалению, решения найти не удалось.
Порт 10051 на сервере открыт, firewall нет. Ошибка происходит только при включенных пассивных проверках. Допустим, есть хотя бы одна пассивная проверка и она настроена на запуск каждые 5 минут. В 15-05 следующий запуск, в 15-04 еще sender возвращает данные, с 15-05 по 15-06 - уже нет (видим ошибку). Воспроизводится это не всегда - в среднем одна ошибка на 2-3 успешных запуска (возможно, в эти моменты просто пассивные проверки отрабатывают быстрее). Если в момент ошибки на хосте запустить netstat - будет видно, что хост активно пытается установить соединение с 10051 портом сервера (находится в статусе SYN_SENT), но ответа не получает. Как только пассивная проверка отключается - каждый запуск sender становится успешным, потерь нет.
И еще одна особенность - пробовали настроить активные проверки (для элементов данных с типом "Zabbix агент (активный)") - они одновременно с пассивными проверками работают, но в логе при получения списка активных итемов с сервера периодически появляется все та же ошибка: " 3736:20170117:161538.336 active check configuration update from [X.X.X.X:10051] started to fail (cannot connect to [[X.X.X.X]:10051]: A connection timeout occurred.)
3736:20170117:161808.145 active check configuration update from [X.X.X.X:10051] is working again
3736:20170117:161931.076 active check data upload to [X.X.X.X:10051] started to fail ([connect] cannot connect to [[X.X.X.X]:10051]: A connection timeout occurred.)
3736:20170117:162015.178 active check data upload to [X.X.X.X:10051] is working again".
Вопрос: возможна ли одновременная работа активных и пассивных проверок на одном хосте и, если возможна, что для этого необходимо предпринять? И в чем может быть причина возникающей у нас ошибки? Заранее спасибо.
Возникла необходимость на одном из таких хостов получать дополнительные данные путем вызова утилиты zabbix_sender.
Через web-интерфейс zabbix-а был настроен новый элемент данных с типом "Zabbix траппер". Если на машине, с которой требуется отправка этих данных, запустить утилиту zabbix_sender (zabbix_sender.exe -z <адрес сервера> -s <имя узла сети> -p <порт сервера> -k <ключ элемента данных> -o <значение элемента данных> -vv) - она отрабатывает только в то время, когда не выполняются ранее настроенные пассивные проверки от сервера к агенту.
Если же запустить sender в момент такой проверки - возвращается ошибка Connection timeout occured, после завершения проверки - sender снова отрабатывает, данные передаются на сервер корректно (их можно просмотреть через web-интерфейс zabbix-сервера, данные обновляются).
Полный текст ошибки, возвращаемой sender-ом в момент запуска пассивных проверок сервера к агенту: zabbix_sender.exe [6988]: DEBUG: send value error: cannot connect to [[X.X.X.X]:10051]: A connection timeout occurred. Sending failed.
По данному вопросу уже проведена большая аналитическая работа (подробности можно посмотреть в http://stackoverflow.com/questions/4...o-not-work-sim), но, к сожалению, решения найти не удалось.
Порт 10051 на сервере открыт, firewall нет. Ошибка происходит только при включенных пассивных проверках. Допустим, есть хотя бы одна пассивная проверка и она настроена на запуск каждые 5 минут. В 15-05 следующий запуск, в 15-04 еще sender возвращает данные, с 15-05 по 15-06 - уже нет (видим ошибку). Воспроизводится это не всегда - в среднем одна ошибка на 2-3 успешных запуска (возможно, в эти моменты просто пассивные проверки отрабатывают быстрее). Если в момент ошибки на хосте запустить netstat - будет видно, что хост активно пытается установить соединение с 10051 портом сервера (находится в статусе SYN_SENT), но ответа не получает. Как только пассивная проверка отключается - каждый запуск sender становится успешным, потерь нет.
И еще одна особенность - пробовали настроить активные проверки (для элементов данных с типом "Zabbix агент (активный)") - они одновременно с пассивными проверками работают, но в логе при получения списка активных итемов с сервера периодически появляется все та же ошибка: " 3736:20170117:161538.336 active check configuration update from [X.X.X.X:10051] started to fail (cannot connect to [[X.X.X.X]:10051]: A connection timeout occurred.)
3736:20170117:161808.145 active check configuration update from [X.X.X.X:10051] is working again
3736:20170117:161931.076 active check data upload to [X.X.X.X:10051] started to fail ([connect] cannot connect to [[X.X.X.X]:10051]: A connection timeout occurred.)
3736:20170117:162015.178 active check data upload to [X.X.X.X:10051] is working again".
Вопрос: возможна ли одновременная работа активных и пассивных проверок на одном хосте и, если возможна, что для этого необходимо предпринять? И в чем может быть причина возникающей у нас ошибки? Заранее спасибо.

Comment