11. メンテナンス

概要

Zabbixでは、ホストおよびホストグループに対してメンテナンス期間を定義できます。

さらに、トリガータグを指定することで、単一のトリガー(またはトリガーのサブセット)に対してのみメンテナンスを定義することも可能です。 この場合、メンテナンスはそれらのトリガーに対してのみ有効になり、ホストまたはホストグループ内のその他すべてのトリガーはメンテナンス中にはなりません。

メンテナンスには、データ収集ありとデータ収集なしの2種類があります。

「データ収集あり」のメンテナンス中は、トリガーは通常どおり処理され、必要に応じてイベントが作成されます。 ただし、アクション設定で Pause operations for suppressed problems オプションがチェックされている場合、メンテナンス中のホスト/トリガーに対する障害のエスカレーションは一時停止されます。 この場合、通知の送信やリモートコマンドの実行を含む可能性のあるエスカレーションステップは、メンテナンス期間が終了するまで無視されます。 メンテナンス中に抑止されるのはエスカレーションのみであり、障害の復旧および更新操作は抑止されないことに注意してください。

たとえば、障害の発生後 0 分、30 分、60 分にエスカレーションステップが予定されており、実際の障害発生から 10 分後から 40 分後までの 30 分間のメンテナンスがある場合、2 番目と 3 番目のステップは 30 分遅れて、つまり 60 分後と 90 分後に実行されます(障害がまだ継続している場合)。 同様に、メンテナンス中に障害が発生した場合、エスカレーションはメンテナンス終了後に開始されます。

メンテナンス中も通常どおり(遅延なく)障害通知を受け取るには、アクション設定で Pause operations for suppressed problems オプションのチェックを外す必要があります。

(トリガー式で使用される)少なくとも1つのホストがメンテナンスモードでない場合、Zabbixは障害通知を送信します。

メンテナンス中はZabbixサーバーが稼働している必要があります。 メンテナンスは毎分再計算されます。また、メンテナンス期間に変更がある場合は、設定キャッシュが再読み込みされるとすぐに再計算されます。

タイマープロセスは、毎分 0 秒時点でホストの状態をメンテナンスに変更する必要があるか、またはメンテナンスから戻す必要があるかを確認します。 さらに、設定更新後に[maintenance periods]に変更があるかどうかに基づいて、開始/停止すべきメンテナンスがあるかをタイマープロセスが毎秒確認します。 したがって、メンテナンス期間の開始/停止の速度は、設定のupdate interval(デフォルトでは 10 秒)に依存します。 メンテナンス期間の変更には、Active since/Active till 設定は含まれないことに注意してください。 また、既存の有効なメンテナンス期間にホスト/ホストグループが追加された場合、その変更は次の分の開始時にのみタイマープロセスによって有効化されます。

ホストがメンテナンスに入ると、Zabbixサーバーのタイマープロセスは、抑止が必要かどうかを確認するために、すべての未解決の障害を読み取ることに注意してください。 未解決の障害が多数ある場合、これはパフォーマンスに影響する可能性があります。 また、Zabbixサーバーは起動時にも、たとえその時点でメンテナンスが設定されていなくても、すべての未解決の障害を読み取ります。

メンテナンスの種類(「データなし」メンテナンスを含む)に関係なく、Zabbixサーバー(またはプロキシ)は常にデータを収集することに注意してください。 その後、'no data collection' が設定されている場合、そのデータはサーバーによって無視されます。

「データなし」メンテナンスが終了したとき、nodata() 関数を使用するトリガーは、その監視期間内の次回チェックまでは発火しません。

ホストがメンテナンス中にログアイテムが追加され、その後メンテナンスが終了した場合、収集されるのはメンテナンス終了以降の新しいログファイルエントリのみです。

「データなし」タイプのメンテナンス中のホストに対してタイムスタンプ付きの値が送信された場合(たとえば Zabbix sender を使用した場合)、その値は破棄されます。ただし、期限切れのメンテナンス期間に対してタイムスタンプ付きの値を送信することは可能であり、その場合は受け入れられます。

メンテナンス期間、ホスト、グループ、またはタグがユーザーによって変更された場合、その変更は設定キャッシュの同期後にのみ有効になります。

設定

メンテナンス期間を設定するには、次のようにします。

  1. データ収集 > メンテナンス に移動します。
  2. メンテナンス期間の作成 をクリックします(または既存のメンテナンス期間の名前をクリックします)。
  3. フォームにメンテナンスパラメータを入力します。

必須入力フィールドには、赤いアスタリスクが付いています。

Parameter Description
Name メンテナンス期間の名前。
Maintenance type 設定できるメンテナンスタイプは2種類あります。
データ収集あり - メンテナンス中もサーバーによってデータが収集され、トリガーが処理されます。
データ収集なし - メンテナンス中はサーバーによってデータは収集されません。
各タイプが可用性レポートに与える影響については、メンテナンス期間の影響を参照してください。
Active since メンテナンス期間の実行が有効になる日時。
注: この時刻を設定しただけではメンテナンス期間は有効になりません。メンテナンス期間は Periods で設定する必要があります(以下を参照)。
Active till メンテナンス期間の実行が無効になる日時。
Periods このブロックでは、メンテナンスを実施する正確な曜日と時間を定義できます。 をクリックすると、柔軟にメンテナンススケジュールを定義できる Maintenance period フォームを含むポップアップウィンドウが開きます。詳細はメンテナンス期間を参照してください。
Host groups メンテナンスを有効にするホストグループを選択します。指定したホストグループ内のすべてのホストに対してメンテナンスが有効になります。このフィールドはオートコンプリート対応のため、入力を開始すると利用可能なすべてのホストグループのドロップダウンが表示されます。
親ホストグループを指定すると、ネストされたすべてのホストグループも暗黙的に選択されます。そのため、ネストされたグループ内のホストでもメンテナンスが有効になります。
Hosts メンテナンスを有効にするホストを選択します。このフィールドはオートコンプリート対応のため、入力を開始すると利用可能なすべてのホストのドロップダウンが表示されます。
Tags メンテナンス中のホストで、一致するタグを持つ障害を抑制するためのタグを指定します。
複数の条件を設定できます。タグ名の一致では常に大文字と小文字が区別されます。

各条件では、次の2つの演算子を使用できます。
含む - 指定したタグ名を対象とし、タグ値に入力した文字列が含まれるものを含めます(部分一致、大文字と小文字を区別)。
等しい - 指定したタグ名とタグ値を含めます(大文字と小文字を区別)。

条件には次の2つの計算タイプがあります。
And/Or - すべての条件を満たす必要があります。同じタグ名を持つ条件は Or 条件でグループ化されます。
Or - いずれか1つの条件を満たせば十分です。

タグを指定できるのは、With data collection モードが選択されている場合のみです。
Description メンテナンス期間の説明。
メンテナンス期間

メンテナンス期間のウィンドウは、定期または1回限りのメンテナンスの時間をスケジュールするためのものです。
このフォームは動的で、使用可能なフィールドは選択した Period type に応じて変化します。

Period type 説明
One time only 1回限りのメンテナンス期間を設定します:
Date - メンテナンス期間の日時;
Maintenance period length - メンテナンスを有効にする期間。
Daily 毎日のメンテナンス期間を設定します:
Every day(s) - メンテナンスの頻度(1 - (デフォルト) 毎日、2 - 2日ごと、など);
At (hour:minute) - メンテナンスを開始する時刻;
Maintenance period length - メンテナンスを有効にする期間。

Every day(s) パラメータが "1" より大きい場合、開始日は Active since の時刻が属する日になります。例:
- Active since が "2021-01-01 12:00"、Every day(s) が "2"、At (hour:minute) が "23:00" に設定されている場合、最初のメンテナンス期間は1月1日 23:00に開始し、2回目のメンテナンス期間は1月3日 23:00に開始します;
- Active since が "2021-01-01 12:00"、Every day(s) が "2"、At (hour:minute) が "01:00" に設定されている場合、最初のメンテナンス期間は1月3日 01:00に開始し、2回目のメンテナンス期間は1月5日 01:00に開始します。
Weekly 毎週のメンテナンス期間を設定します:
Every week(s) - メンテナンスの頻度(1 - (デフォルト) 毎週、2 - 2週間ごと、など);
Day of week - メンテナンスを実施する曜日;
At (hour:minute) - メンテナンスを開始する時刻;
Maintenance period length - メンテナンスを有効にする期間。

Every week(s) パラメータが "1" より大きい場合、開始週は Active since の時刻が属する週になります。例については、上記の Daily パラメータの説明を参照してください。
Monthly 毎月のメンテナンス期間を設定します:
Month - 定期メンテナンスを実施するすべての月を選択します;
Date: Day of month - メンテナンスを毎月同じ日付(例えば毎月1日)に実施する場合はこのオプションを選択し、表示される Day of month フィールドで必要な日を選択します;
Date: Day of week - メンテナンスを特定の日(例えば毎月第1月曜日)にのみ実施する場合はこのオプションを選択し、次に(ドロップダウンで)必要な週(第1、第2、第3、第4、または最終)を選択し、その後メンテナンスを実施する曜日のチェックボックスをオンにします;
At (hour:minute) - メンテナンスを開始する時刻;
Maintenance period length - メンテナンスを有効にする期間。

メンテナンス期間を作成する際は、それを作成したユーザーのタイムゾーンが使用されます。 ただし、定期的なメンテナンス期間(毎日毎週毎月)をスケジュールする場合は、Zabbixサーバーのタイムゾーンが使用されます。 定期的なメンテナンス期間の動作を予測可能にするため、Zabbixのすべての部分で共通のタイムゾーンを使用する必要があります。

完了したら、Add を押してメンテナンス期間を Periods ブロックに追加します。

サマータイム(DST)の変更は、メンテナンスの継続時間には影響しないことに注意してください。 例えば、通常は 01:00 に開始して 03:00 に終了する、2 時間のメンテナンスが設定されているとします。

  • メンテナンス開始から 1 時間後(02:00)に DST の変更が発生し、現在時刻が 02:00 から 03:00 に変わった場合、メンテナンスはさらに 1 時間継続します(04:00 まで)。
  • メンテナンス開始から 2 時間後(03:00)に DST の変更が発生し、現在時刻が 03:00 から 02:00 に変わった場合、2 時間が経過しているため、メンテナンスは停止します。
  • メンテナンス期間が、DST の変更によってスキップされる時間帯に開始するよう設定されている場合、そのメンテナンスは開始されません。

メンテナンス期間が「1 day」に設定されている場合(Zabbix は日数を時間単位で計算するため、実際のメンテナンス期間は 24 時間です)、00:00 に開始して翌日の 00:00 に終了するとします。

  • 現在時刻が 1 時間進んだ場合、メンテナンスは翌日の 01:00 に停止します。
  • 現在時刻が 1 時間戻った場合、メンテナンスはその日の 23:00 に停止します。

表示

メンテナンス中のホストの表示

ホスト名の横にあるオレンジ色のレンチアイコン は、このホストが以下でメンテナンス中であることを示します。

  • ダッシュボード
  • 監視 > 障害
  • インベントリ > ホスト > ホストインベントリの詳細
  • データ収集 > ホスト(「ステータス」列を参照)

マウスポインターをアイコンの上に置くと、メンテナンスの詳細が表示されます。

さらに、メンテナンス中のホストは 監視 > マップ でオレンジ色の背景で表示されます。

抑制された障害の表示

通常、メンテナンス中のホストの障害は抑制され、つまりWebインターフェースには表示されません。 ただし、以下の場所で Show suppressed problems オプションを選択することで、抑制された障害を表示するよう設定することもできます。

  • ダッシュボードProblem hostsProblemsProblems by severityTrigger overview ウィジェット設定内)
  • 監視 > 障害(フィルター内)
  • 監視 > マップ(マップ設定内)
  • グローバル 通知 (ユーザープロファイル設定内)

抑制された障害が表示される場合、次のアイコンが表示されます: 。 アイコンにマウスカーソルを合わせると、さらに詳細が表示されます。

メンテナンス中のキューの計算

ZabbixのWebインターフェース(Administration > Queue)に表示されるキューは、Zabbixサーバーによって計算されます。
データ収集を行わないメンテナンス中のアイテムは含まれません。このようなアイテムは、値の取得が遅延している場合でも、キュー長は常にゼロです。
データ収集を行うメンテナンス中の遅延アイテムは、引き続きキューにカウントされます。

Zabbixのプロキシは、Zabbixサーバーとプロキシの間でメンテナンス設定が同期されないため、メンテナンス期間を認識しません。
Zabbixプロキシ上で計算される内部チェック(たとえば、zabbix[queue,,] および zabbix[stats,,,queue,,])は、Zabbixサーバー上のメンテナンス状態に関係なく、遅延アイテムを報告します。

その結果、データ収集を行わないメンテナンス中の同じアイテムについて、ZabbixのWebインターフェースとZabbixプロキシ上の内部チェックとで、異なるキュー長が報告される場合があります。