Здравствуйте уважаемые форумчане.
Имеется Debian 8 + Zabbix Server на Postgresql
Относительно недавно плотно занялись собственными скриптами\шаблонами zabbix как для Windows, так и Linux. Из-за постоянных добавлений новых шаблонов собственной разработки, пришлось поднимать репозиторий на GIT и делать батник автообновления по расписанию.
Машин около 250 в общем.
Касаемо Windows, cуть в том что если в нашем репозитории обновилась версия (то бишь исправление\добавлено) то батник выкачивает апдейты, останавливает службу агента, ставит новые скрипты для UserParam, и по окончанию запускает службу заббикс агента.
Все обрадовались, сделал новый скрипт\шаблон засунул в репу. Ночью само обновилось к утру уже всё работает. Таким образом пропала потребность в муторной пробежке по всем машинам и обновления скриптов мониторинга.
------------------
Всё это шло не долго. Начали замечать что после обновления не всегда служба корректно поднимается. Обновили апдейтер добавив таймаут.
Кое как это спасло. Но теперь же агент не запускается даже в ручную.
В логах ошибка:
1124:20161209:220127.125 listener failed: bind() for [[-]:10050] failed: [0x00002740] Обычно разрешается только одно использование адреса сокета (протокол/сетевой адрес/порт).
Смотрим чем занят порт 10050, находим PID. Смотрим по пиду что за процесс, а его уже давно нет. Перезапуски службы не помогают, пробовали выключать все процессы, оставив только системные. Всё равно жалуется на занятость сокета. Помогает ребут. Данная проблема у тех кто работает через zabbix proxy. Собственно ребут заббикс прокси (как службы\так и самой машины не помогает)
Есть ли какие либо мнения?
Имеется Debian 8 + Zabbix Server на Postgresql
Относительно недавно плотно занялись собственными скриптами\шаблонами zabbix как для Windows, так и Linux. Из-за постоянных добавлений новых шаблонов собственной разработки, пришлось поднимать репозиторий на GIT и делать батник автообновления по расписанию.
Машин около 250 в общем.
Касаемо Windows, cуть в том что если в нашем репозитории обновилась версия (то бишь исправление\добавлено) то батник выкачивает апдейты, останавливает службу агента, ставит новые скрипты для UserParam, и по окончанию запускает службу заббикс агента.
Все обрадовались, сделал новый скрипт\шаблон засунул в репу. Ночью само обновилось к утру уже всё работает. Таким образом пропала потребность в муторной пробежке по всем машинам и обновления скриптов мониторинга.
------------------
Всё это шло не долго. Начали замечать что после обновления не всегда служба корректно поднимается. Обновили апдейтер добавив таймаут.
Кое как это спасло. Но теперь же агент не запускается даже в ручную.
В логах ошибка:
1124:20161209:220127.125 listener failed: bind() for [[-]:10050] failed: [0x00002740] Обычно разрешается только одно использование адреса сокета (протокол/сетевой адрес/порт).
Смотрим чем занят порт 10050, находим PID. Смотрим по пиду что за процесс, а его уже давно нет. Перезапуски службы не помогают, пробовали выключать все процессы, оставив только системные. Всё равно жалуется на занятость сокета. Помогает ребут. Данная проблема у тех кто работает через zabbix proxy. Собственно ребут заббикс прокси (как службы\так и самой машины не помогает)
Есть ли какие либо мнения?
Comment