Имеется Узел связи. На него стандартным шаблоном SNMP прикручены элементы и триггеры. При срабатывании триггера "No SNMP data collection" настроено действие: по телнету (с указанием пароля и пользователя) отправляется команда reboot.
В качестве эксперимента закрываем 161 порт на устройство. Через 3 минуты (у нас так указано в макросе Zabbix) срабатывает триггер, но вот по Телнет перегружается устройство даже не через раз, а через 3-5 раз. При этом в информации на дашборде отображается ошибка в результате действия "Cannot find prompt after command execution: [11] Resource temporarily unavailable". Пытались найти различия в лог-файле Заббикса (ставили Debug level = 4). Но ничего не нашли. Разве что видно, что в случае успешной перезагрузки в лог-файле Заббикса больше строк общения скрипта. Такое впечатление, что скрипт обработки действия скрипта по Телнету не дожидается ответа/приглашения от удалённого устройства и вываливается по таймауту. Это как предположение... Связь с удалённым устройством через L2TP тоннель, но более-менее стабильная. По крайней мере пинги проходят все, около 65 мс.
В качестве эксперимента закрываем 161 порт на устройство. Через 3 минуты (у нас так указано в макросе Zabbix) срабатывает триггер, но вот по Телнет перегружается устройство даже не через раз, а через 3-5 раз. При этом в информации на дашборде отображается ошибка в результате действия "Cannot find prompt after command execution: [11] Resource temporarily unavailable". Пытались найти различия в лог-файле Заббикса (ставили Debug level = 4). Но ничего не нашли. Разве что видно, что в случае успешной перезагрузки в лог-файле Заббикса больше строк общения скрипта. Такое впечатление, что скрипт обработки действия скрипта по Телнету не дожидается ответа/приглашения от удалённого устройства и вываливается по таймауту. Это как предположение... Связь с удалённым устройством через L2TP тоннель, но более-менее стабильная. По крайней мере пинги проходят все, около 65 мс.
Comment