Добрый день.
Только изучаю Zabbix.
Отслеживаю только станции Windows стандартным шаблоном Template OS Windows.
1.
Вижу что сработал триггер "Service АААА is not running (startup type automatic) "
Сервис АААА - это остатки ранее работавшей программы , которая , судя по всему, была не совсем корректно удалена. Но сейчас мне этот сервис точно не нужен.
Ок, удаляю полностью сервис АААА.
Но триггер продолжает сигнализировать о проблеме с этим сервисом. Хотя его уже физически нет.
Руками закрыть проблему я не могу , потому что поле "Close problem" недоступна.
Иду в настройки триггера Configuration - Templates - Template OS Windows - Discovery rules - Windows service discovery- Trigger prototypes - Service "{#SERVICE.NAME}" ({#SERVICE.DISPLAYNAME}) is not running (startup type {#SERVICE.STARTUPNAME}) - включаю опцию Allow manual close - сохраняю.
Это изменение применяется ко всем триггерам , за исключением тех , которые активны и сигнализируют о проблеме. Т.е. в данном случае как раз кроме тех, которые мне и надо выключить.
Подозреваю, что триггеру чтобы выключится нужно чтобы этот сервис был запущен. Но это невозможно, его уже физически нет.
Иду еще раз в настройки триггера Configuration - Templates - Template OS Windows - Discovery rules - Windows service discovery- Trigger prototypes - Service "{#SERVICE.NAME}" ({#SERVICE.DISPLAYNAME}) is not running (startup type {#SERVICE.STARTUPNAME}) и добавляю в поле Recovery Expression {Template OS Windows:service.info[{#SERVICE.NAME},state].min(#3)}=255. Т.е. я хочу сказать что проблема решена когда службы не существует.
Но опять же эти изменения применяются для всех триггеров, кроме того, который мне нужен.
Как вырубить этот триггер?
Т.е. можно конечно его физически удалить , но это надо в каждую рабочую станцию заходить и удалять его руками
Или например удалить шаблон с этого хоста с удалением всех данных , а затем заново его подключить... но наверно это не очень правильно, думаю что есть более лучшие и более простые практики решения таких проблем.
2.
Есть службы , у которых тип запуска "Автоматически", но постоянно они в системе не работают , запускаются через определенные периоды, а затем система их опять выключает.
Например Service "wuauserv" (Центр обновления Windows) , эта служба на Windows server 2012 то запускается то выключается, и это для нее нормальный, штатный режим работы.
Но Zabbix, отслеживая работу всех служб у которых тип запуска "автоматически", постоянно на каждое выключение шлет на email alert , а на каждое включение - "проблема решена"
Как правильно сопровождать такие события?
Чтобы и службы отслеживать оперативно и одновременно чтобы zabbix не мусорил на email постоянными сообщениями о мнимых проблемах?
Только изучаю Zabbix.
Отслеживаю только станции Windows стандартным шаблоном Template OS Windows.
1.
Вижу что сработал триггер "Service АААА is not running (startup type automatic) "
Сервис АААА - это остатки ранее работавшей программы , которая , судя по всему, была не совсем корректно удалена. Но сейчас мне этот сервис точно не нужен.
Ок, удаляю полностью сервис АААА.
Но триггер продолжает сигнализировать о проблеме с этим сервисом. Хотя его уже физически нет.
Руками закрыть проблему я не могу , потому что поле "Close problem" недоступна.
Иду в настройки триггера Configuration - Templates - Template OS Windows - Discovery rules - Windows service discovery- Trigger prototypes - Service "{#SERVICE.NAME}" ({#SERVICE.DISPLAYNAME}) is not running (startup type {#SERVICE.STARTUPNAME}) - включаю опцию Allow manual close - сохраняю.
Это изменение применяется ко всем триггерам , за исключением тех , которые активны и сигнализируют о проблеме. Т.е. в данном случае как раз кроме тех, которые мне и надо выключить.
Подозреваю, что триггеру чтобы выключится нужно чтобы этот сервис был запущен. Но это невозможно, его уже физически нет.
Иду еще раз в настройки триггера Configuration - Templates - Template OS Windows - Discovery rules - Windows service discovery- Trigger prototypes - Service "{#SERVICE.NAME}" ({#SERVICE.DISPLAYNAME}) is not running (startup type {#SERVICE.STARTUPNAME}) и добавляю в поле Recovery Expression {Template OS Windows:service.info[{#SERVICE.NAME},state].min(#3)}=255. Т.е. я хочу сказать что проблема решена когда службы не существует.
Но опять же эти изменения применяются для всех триггеров, кроме того, который мне нужен.
Как вырубить этот триггер?
Т.е. можно конечно его физически удалить , но это надо в каждую рабочую станцию заходить и удалять его руками
Или например удалить шаблон с этого хоста с удалением всех данных , а затем заново его подключить... но наверно это не очень правильно, думаю что есть более лучшие и более простые практики решения таких проблем.
2.
Есть службы , у которых тип запуска "Автоматически", но постоянно они в системе не работают , запускаются через определенные периоды, а затем система их опять выключает.
Например Service "wuauserv" (Центр обновления Windows) , эта служба на Windows server 2012 то запускается то выключается, и это для нее нормальный, штатный режим работы.
Но Zabbix, отслеживая работу всех служб у которых тип запуска "автоматически", постоянно на каждое выключение шлет на email alert , а на каждое включение - "проблема решена"
Как правильно сопровождать такие события?
Чтобы и службы отслеживать оперативно и одновременно чтобы zabbix не мусорил на email постоянными сообщениями о мнимых проблемах?
Comment