11 到達不能/使用不可のホストインターフェース設定

概要

いくつかの設定 パラメーター により、エージェントチェック(Zabbix、SNMP、IPMI、JMX)が失敗し、ホストインターフェースに到達できなくなった場合に、Zabbixサーバーがどのように動作するかが定義されます。

到達不能なインターフェース

ホストインターフェースは、Zabbix、SNMP、IPMI、または JMX エージェントによるチェックが失敗した場合(ネットワークエラー、タイムアウト)に到達不能と見なされます。Zabbix 6.2.0 以降では、アクティブな Zabbix エージェントのチェックもインターフェースの可用性に影響します。アクティブチェックが利用できなくなると、エージェントインターフェース全体の可用性ステータスに反映されます。

インターフェースが到達不能になった時点から、UnreachableDelay により、1つのアイテム(LLD ルールを含む)を使用して再チェックを行う頻度が定義されます。
これらの再チェックは、到達不能ポーラー(IPMI チェックの場合は IPMI ポーラー)によって実行されます。
デフォルトでは、連続する到達性チェックの間隔は 15 秒です。

非同期ポーラーによって実行されるチェックは、到達不能ポーラーに移動されません。

Zabbix サーバーのログでは、到達不能状態は次のようなメッセージで示されます。

Zabbix agent item "system.cpu.load[percpu,avg1]" on host "New host" failed: first network error, wait for 15 seconds
Zabbix agent item "system.cpu.load[percpu,avg15]" on host "New host" failed: another network error, wait for 15 seconds

ログメッセージには、失敗した正確なアイテムとその種類(Zabbix エージェント)が記載されます。

Timeout パラメータは、到達不能時にインターフェースをどの程度早く再チェックするかにも影響します。Timeout を 20 秒、UnreachableDelay を 30 秒に設定した場合、最初の試行から 50 秒後に次のチェックが行われます。

UnreachablePeriod パラメータは、到達不能期間の合計時間を定義します。デフォルトの UnreachablePeriod は 45 秒です。
この値は、インターフェースが利用不可と判定される前に複数回再チェックされるよう、UnreachableDelay よりも数倍大きく設定する必要があります。

内部アイテム zabbix[host,active_agent,available] を使用すると、到達不能なシナリオにおけるアクティブチェックの可用性を監視できます。

インターフェイスを到達可能に戻す

到達不能期間が終了すると、インターフェイスが再度ポーリングされ、インターフェイスを到達不能状態にしたアイテムの優先度が低下します。到達不能なインターフェイスが再び到達可能になると、監視は自動的に通常に戻ります。

resuming Zabbix agent checks on host "New host": connection restored

インターフェイスが使用可能になっても、ホストは次の2つの理由ですべてのアイテムをすぐにポーリングしません。

  • ホストが過負荷になる可能性があります。
  • インターフェイスの復元時間は、計画されたアイテムのポーリングスケジュール時間と常に一致するとは限りません。

そのため、インターフェイスが使用可能になった後、アイテムはすぐにはポーリングされず、次のポーリングラウンドに再スケジュールされます。

利用できないインターフェース

UnreachablePeriodが終了し、インターフェースが再び利用可能にならなかった場合、そのインターフェースは利用できないものとして扱われます。

サーバーログには、次のようなメッセージが表示されます。

temporarily disabling Zabbix agent checks on host "New host": interface unavailable

また、 フロントエンド では、ホストの可用性アイコンが緑/グレーから黄/赤に変わります(利用できないインターフェースの詳細は、ホストの可用性アイコンにマウスを合わせたときに表示されるヒントボックスで確認できます)。

UnavailableDelayパラメータは、インターフェースが利用できない間にどのくらいの頻度でインターフェースをチェックするかを定義します。

デフォルトでは60秒です(この場合、上記のログメッセージの「temporarily disabling」は、1分間チェックを無効にすることを意味します)。

インターフェースへの接続が復旧すると、監視も自動的に通常状態に戻ります。

enabling Zabbix agent checks on host "New host": interface became available