Sidebar

Zabbix Summit 2022
Register for Zabbix Summit 2022

6 Ustawienia nieosiągalności/niedostępności hosta

Przegląd

Wiele parametrów konfiguracji definiuje zachowanie serwera Zabbix w sytuacji, gdy nie powiedzie się sprawdzenie agenta (Zabbix, SNMP, IPMI, JMX) i host stanie się nieosiągalny.

Host nieosiągalny

Host jest traktowany jako nieosiągalny, gdy wystąpi błąd sprawdzenia (błąd sieciowy, opóźnienie) agenta Zabbix, SNMP, IPMI lub JMX. Należy zauważyć, że testy aktywne agenta Zabbix nie wpływają w żaden sposób na dostępność hosta.

Od wersji Zabbix 2.2.11, jeżeli pomiędzy dwoma błędnymi sprawdzeniami jednej pozycji, sprawdzenie innej pozycji się powiedzie, problematyczna pozycja zostanie zaznaczona jako niewspierana, bez uznawania hosta za niedostępny. W Zabbix 2.2.12 zostało to usunięte.

Od tego momentu UnreachableDelay definiuje jak często host będzie ponownie sprawdzany przy użyciu jednej z pozycji (włącznie z niskopoziomowymi regułami wykrywania), w sytuacji niedostępności takie ponowne sprawdzenia będą wykonywane przez dedykowane procesy odbiorcze niedostępności (unreachable pollers). Domyślnie kolejne sprawdzenia nastąpią co 15 sekund.

W logu serwera Zabbix nieosiągalność jest sygnalizowana komunikatem jak ten:

Zabbix agent item "system.cpu.load[percpu,avg1]" on host "New host" failed: first network error, wait for 15 seconds
       Zabbix agent item "system.cpu.load[percpu,avg15]" on host "New host" failed: another network error, wait for 15 seconds

Należy zauważyć, że jest podawana dokładna nazwa błędnej pozycji i jej typ (Zabbix agent).

Parametr Timeout również wpływa na to, kiedy host zostanie ponownie sprawdzony podczas niedostępności. Jeżeli Timeout to 20 sekund a UnreachableDelay to 30 sekund, to następne sprawdzenie zostanie wykonane po 50 sekundach od pierwszego.

Parametr UnreachablePeriod definiuje jak długi jest okres nieosiągalności. Domyślnie UnreachablePeriod jest równy 45 sekund. UnreachablePeriod powinien być kilka razy większy niż UnreachableDelay, żeby host był sprawdzony więcej niż raz, zanim zostanie uznany za niedostępny.

Jeżeli nieosiągalność hosta ustąpi, monitorowanie wróci do normy automatycznie:

resuming Zabbix agent checks on host "New host": connection restored

Host niedostępny

Po zakończeniu okresu UnreachablePeriod, gdy host dalej jest nieosiągalny, host zaczyna być traktowany jako niedostępny.

W logu serwera jest to sygnalizowane komunikatem jak ten:

temporarily disabling Zabbix agent checks on host "New host": host unavailable

A w interfejsie użytkownika ikona dostępności hosta z zielonej zmienia się na czerwoną (najechanie myszką powoduje pokazanie podpowiedzi z opisem błędu):

Parametr UnavailableDelay definiuje jak często host jest sprawdzany podczas niedostępności.

Domyślnie jest to 60 sekund (w tym przypadku "temporarily disabling" z komunikatu powyżej oznacza wyłączenie sprawdzeń na jedną minutę).

Po przywróceniu połączenia z hostem, monitorowanie również wraca do normy automatycznie:

enabling Zabbix agent checks on host "New host": host became available