Добрый день, уважаемые коллеги.
Потихоньку продолжаю изучение ZABBIX. Столкнулся с очередной проблемой, и не смог найти решение самостоятельно.
Задача: Есть агенты на которых крутиться важная служба. ПК с этой службой уходят в ребут в определенное время, но только в том случае если это самая служба остановлена корректна, в противной случае "Алярм"
И перезагрузка отменяется. Ну и разумным видеться подбирать логи этой службы на сервер и реагировать на ошибки.
Поступил я следующим образом.
Создал item с ключом service info[name service, state]. И прикрутил к этому ключу два триггера. Один из них просто выводит в "проблемы" все что происходит с службой. (last()}>0)
Другой триггер реагирует только на ответ от агента который равен "6" (last()}=6
И к последнему прикрутил действие на перезагрузку. Все работает, все перегружает.
Но вот лог собрать не получается.
Исходят из документации, я создаю активную проверку.
logrt[C:\ProgramData\ATOL\Frontol5\Logs\Service.l og,Связь_с_базой_установлена,ANSI,10,] (Почему именно "Связь_с_базой_установлена", исключительно ради проверки работоспособности, ибо эта запись появляется при запуске.)
На стороне агента изменяю параметры в файле zabbix_agentd.conf
EnableRemoteCommands=1
Server=(ип сервер заббикса)
ServerActive=(ип сервера заббикс)
Hostname=NAME идентично имени узла на сервере.
В "Узлах сети" в "элементах данных" состояние "Активно"
В логах на агенте следующие строки после перезапуска.
2252:20190611:155738.752 Starting Zabbix Agent [HOSTNAME]. Zabbix 4.2.1 (revision 92832).
2252:20190611:155738.752 **** Enabled features ****
2252:20190611:155738.752 IPv6 support: YES
2252:20190611:155738.752 TLS support: YES
2252:20190611:155738.752 **************************
2252:20190611:155738.752 using configuration file: C:\Program Files\Zabbix Agent\zabbix_agentd.conf
2252:20190611:155738.767 agent #0 started [main process]
2264:20190611:155738.767 agent #1 started [collector]
2268:20190611:155738.767 agent #2 started[listener #1]
2272:20190611:155738.767 agent #3 started[listener #2]
2280:20190611:155738.767 agent #5 started [active checks #1]
2276:20190611:155738.767 agent #4 started[listener #3]
И все. В последних данных на этом узле связи новых itemов не появилось.
Буду рад любому совету.
Спасибо.
Потихоньку продолжаю изучение ZABBIX. Столкнулся с очередной проблемой, и не смог найти решение самостоятельно.
Задача: Есть агенты на которых крутиться важная служба. ПК с этой службой уходят в ребут в определенное время, но только в том случае если это самая служба остановлена корректна, в противной случае "Алярм"
И перезагрузка отменяется. Ну и разумным видеться подбирать логи этой службы на сервер и реагировать на ошибки.
Поступил я следующим образом.
Создал item с ключом service info[name service, state]. И прикрутил к этому ключу два триггера. Один из них просто выводит в "проблемы" все что происходит с службой. (last()}>0)
Другой триггер реагирует только на ответ от агента который равен "6" (last()}=6
И к последнему прикрутил действие на перезагрузку. Все работает, все перегружает.
Но вот лог собрать не получается.
Исходят из документации, я создаю активную проверку.
logrt[C:\ProgramData\ATOL\Frontol5\Logs\Service.l og,Связь_с_базой_установлена,ANSI,10,] (Почему именно "Связь_с_базой_установлена", исключительно ради проверки работоспособности, ибо эта запись появляется при запуске.)
На стороне агента изменяю параметры в файле zabbix_agentd.conf
EnableRemoteCommands=1
Server=(ип сервер заббикса)
ServerActive=(ип сервера заббикс)
Hostname=NAME идентично имени узла на сервере.
В "Узлах сети" в "элементах данных" состояние "Активно"
В логах на агенте следующие строки после перезапуска.
2252:20190611:155738.752 Starting Zabbix Agent [HOSTNAME]. Zabbix 4.2.1 (revision 92832).
2252:20190611:155738.752 **** Enabled features ****
2252:20190611:155738.752 IPv6 support: YES
2252:20190611:155738.752 TLS support: YES
2252:20190611:155738.752 **************************
2252:20190611:155738.752 using configuration file: C:\Program Files\Zabbix Agent\zabbix_agentd.conf
2252:20190611:155738.767 agent #0 started [main process]
2264:20190611:155738.767 agent #1 started [collector]
2268:20190611:155738.767 agent #2 started[listener #1]
2272:20190611:155738.767 agent #3 started[listener #2]
2280:20190611:155738.767 agent #5 started [active checks #1]
2276:20190611:155738.767 agent #4 started[listener #3]
И все. В последних данных на этом узле связи новых itemов не появилось.
Буду рад любому совету.
Спасибо.
Comment