1 障害

概要

監視 > 障害 では、現在発生している障害を確認できます。 障害とは、"Problem" 状態にあるトリガーです。

デフォルトでは、すべての新しい障害は原因障害として分類されます。 特定の障害を、原因障害の症状障害として手動で再分類することも可能です。 詳細については、原因イベントと症状イベントを参照してください。

説明
チェックボックス 障害を選択するためのチェックボックスが表示されます。
チェックボックスの横に表示されるアイコンには、次の意味があります。
icon\_number.png - 原因障害に対する症状イベントの数;
icon\_expand.png - 展開して症状イベントを表示;
icon\_collapse.png - 折りたたんで症状イベントを非表示;
icon\_symptom.png - これは症状イベントです。
時刻 障害の開始時刻が表示されます。
深刻度 障害の深刻度が表示されます。
障害の深刻度は元々、基になる障害トリガーの深刻度に基づいていますが、イベント発生後に 障害の更新 画面を使用して更新できます。障害発生中は、障害の深刻度の色がセルの背景色として使用されます。
復旧時刻 障害の解決時刻が表示されます。
ステータス 障害のステータスが表示されます。
Problem - 未解決の障害
Resolved - 最近解決された障害。最近解決された障害はフィルターを使用して非表示にできます。
新しい障害と最近解決された障害は 2 分間点滅します。解決済みの障害は合計 5 分間表示されます。これらの値はいずれも、管理 > 一般 > トリガー表示オプション で設定できます。
情報 障害がグローバル相関関係によって、または障害更新時に手動でクローズされた場合、緑色の情報アイコンが表示されます。アイコンにマウスカーソルを合わせると、詳細が表示されます。
info.png
抑制された障害が表示されている場合は、次のアイコンが表示されます(フィルターの 抑制された障害を表示 オプションを参照)。アイコンにマウスカーソルを合わせると、詳細が表示されます。
ホスト 障害が発生しているホストが表示されます。
ホスト名をクリックすると、ホストメニューが表示されます。
障害 障害名が表示されます。
障害名は、基になる障害トリガーの名前に基づいています。
トリガー名内のマクロは障害発生時に展開され、その後は展開済みの値は更新されません。
運用データを追加して、最新のアイテム値を障害名の後ろに表示することも可能です。
障害名をクリックすると、イベントメニューが表示されます。
障害名の後にある アイコンにマウスカーソルを合わせると、トリガーの説明が表示されます(説明が設定されている障害のみ)。
運用データ 最新のアイテム値を含む運用データが表示されます。
運用データは、トリガーレベルで設定されている場合、テキストとアイテム値マクロの組み合わせにできます。トリガーレベルで運用データが設定されていない場合は、式に含まれるすべてのアイテムの最新値が表示されます。
この列は、フィルターの 運用データの表示個別 が選択されている場合にのみ表示されます。
期間 障害の継続時間が表示されます。
参照: 負の障害期間
更新 更新 リンクをクリックすると、障害更新画面に移動し、コメントの追加や障害の確認を含むさまざまな操作を障害に対して実行できます。
アクション 障害に関するアクティビティの履歴が、記号アイコンを使用して表示されます。
icon\_acknowledged\_green.png - 障害が確認されています。このアイコンは常に最初に表示されます。
icon\_comment.png - コメントが追加されています。コメント数も表示されます。
icon\_sev\_up1.png - 障害の深刻度が上げられています(例: Information → Warning)。
icon\_sev\_down1.png - 障害の深刻度が下げられています(例: Warning → Information)。
icon\_severity\_back.png - 障害の深刻度が変更された後、元のレベルに戻っています(例: Warning → Information → Warning)。
icon\_suppression.png - 障害が抑制されています。
icon\_unsuppressed.png - 障害の抑制が解除されています。
icon\_actions.png - アクションが実行されています。アクション数も表示されます。
icon\_actions\_progress1.png - アクションが実行されており、少なくとも 1 つが進行中です。アクション数も表示されます。
icon\_actions\_failed.png - アクションが実行されており、少なくとも 1 つが失敗しています。アクション数も表示されます。
アイコンにマウスカーソルを合わせると、アクティビティの詳細を示すポップアップが表示されます。実行されたアクションのポップアップで使用されるアイコンの詳細については、詳細の表示を参照してください。
タグ タグが表示されます(存在する場合)。
さらに、外部チケットシステムからのタグが表示される場合もあります(webhook設定時の タグを処理 オプションを参照)。

障害の運用データ

現在の障害について運用データ、つまり障害発生時点のアイテム値ではなく、最新のアイテム値を表示できます。

運用データの表示は、監視 > 障害 のフィルタ、または該当するダッシュボードウィジェットの設定で、次の3つのオプションのいずれかを選択して構成できます。

  • なし - 運用データは表示されません
  • 別表示 - 運用データは別の列に表示されます

  • 障害名とともに表示 - 運用データは障害名の後ろに括弧付きで追加されます。
    トリガー設定の Operational data フィールドが空でない場合にのみ、運用データが障害名に追加されます。

運用データの内容は、各トリガーOperational data フィールドで設定できます。
このフィールドでは、マクロを含む任意の文字列を使用できますが、特に重要なのは {ITEM.LASTVALUE<1-9>} マクロです。

このフィールド内の {ITEM.LASTVALUE<1-9>} は、常にトリガー条件式内のアイテムの最新値に展開されます。
このフィールド内の {ITEM.VALUE<1-9>} は、トリガー状態が変化した時点のアイテム値(つまり、障害への変化、OKへの変化、ユーザーによる手動クローズ、または相関ルールによるクローズ)に展開されます。

問題を手動でクローズしても新しい値は生成されないため、{ITEM.LASTVALUE<1-9>} または {ITEM.VALUE<1-9>} の展開結果には、引き続き障害発生時点の値が表示される点に注意してください。

{ITEM.LASTVALUE<1-9>} または {ITEM.VALUE<1-9>} は、最新の履歴値が Max history display period より前に収集されたものである場合、*UNKNOWN* に展開されます(管理 > 一般 を参照)。

負の障害期間

実際には、一般的ないくつかの状況において、障害の解決時刻が障害の作成時刻よりも前になる場合、つまり障害期間が負になることがあります。例えば、次のような場合です。

  • あるホストがプロキシによって監視されており、ネットワークエラーが発生して、しばらくの間プロキシからデータを受信できなくなると、サーバーによって nodata(/host/key) トリガーが発生します。
    接続が復旧すると、サーバーは過去の時刻を持つアイテムデータをプロキシから受信します。
    その後、nodata(/host/key) の障害は解決され、障害期間は負になります。
  • 障害イベントを解決するアイテムデータが Zabbix sender によって送信され、そのタイムスタンプが障害の作成時刻より前である場合にも、負の障害期間が表示されます。

負の障害期間は、特定のトリガーの SLA calculationAvailability report にいかなる影響も与えません。障害時間を短縮することも延長することもありません。

一括編集オプション

一覧の下にあるボタンでは、いくつかの一括編集オプションを利用できます。

  • 一括更新 - 障害の更新画面に移動して、選択した障害を更新します

このオプションを使用するには、対象の障害の前にあるチェックボックスをオンにしてから、一括更新ボタンをクリックします。

ボタン

右側のボタンでは、以下のオプションを利用できます。

すべてのページの内容をCSVファイルにエクスポートします。

表示モードのボタンは、すべてのセクションで共通のため、Monitoring ページで説明しています。

フィルターの使用

フィルターを使用すると、関心のある障害のみを表示できます。 検索パフォーマンスを向上させるため、データはマクロを未展開のまま検索されます。

フィルターはテーブルの上部にあります。 お気に入りのフィルター設定はタブとして保存でき、フィルター上部のタブをクリックしてすばやくアクセスできます。

Parameter Description
Show 障害ステータスでフィルタリングします:
Recent problems - 未解決および最近解決された障害を表示します(デフォルト)
Problems - 未解決の障害を表示します
History - すべてのイベントの履歴を表示します
Host groups 1つ以上のホストグループでフィルタリングします。
親ホストグループを指定すると、ネストされたすべてのホストグループも暗黙的に選択されます。
Hosts 1つ以上のホストでフィルタリングします。
Triggers 1つ以上のトリガーでフィルタリングします。
Problem 障害名でフィルタリングします。
Severity トリガー(障害)の深刻度でフィルタリングします。
Age less than 障害の発生からの経過時間でフィルタリングします。
Show symptoms チェックボックスをオンにすると、症状として分類された障害を独立した行に表示します。
Show suppressed problems チェックボックスをオンにすると、ホストのメンテナンスまたは個別の障害抑制により通常は抑制されて表示されない障害を表示します。
Acknowledgement status すべての障害、未確認の障害のみ、または確認済みの障害のみを表示するようフィルタリングします。追加のチェックボックスをオンにすると、自分が一度でも確認した障害を除外できます。
Host inventory インベントリのタイプと値でフィルタリングします。
Tags イベントタグの名前と値でフィルタリングします。特定のタグおよびタグ値を含めることも除外することもできます。複数の条件を設定できます。タグ名の一致は常に大文字と小文字を区別します。
各条件では複数の演算子を使用できます:
Exists - 指定したタグ名を含めます
Equals - 指定したタグ名と値を含めます(大文字と小文字を区別)
Contains - タグ値に入力した文字列を含む指定タグ名を含めます(部分一致、大文字と小文字を区別しない)
Does not exist - 指定したタグ名を除外します
Does not equal - 指定したタグ名と値を除外します(大文字と小文字を区別)
Does not contain - タグ値に入力した文字列を含む指定タグ名を除外します(部分一致、大文字と小文字を区別しない)
条件には2つの計算タイプがあります:
And/Or - すべての条件を満たす必要があります。同じタグ名を持つ条件は Or 条件でグループ化されます
Or - いずれか1つの条件を満たせば十分です
フィルタリング時には、ここで指定したタグが障害とともに最初に表示されます。ただし、Tag display priority(以下参照)リストで上書きされる場合があります。
Show tags 表示するタグ数を選択します:
None - Monitoring > ProblemsTags 列を表示しません
1 - Tags 列に1つのタグを表示します
2 - Tags 列に2つのタグを表示します
3 - Tags 列に3つのタグを表示します
障害のすべてのタグを表示するには、三点アイコンにマウスカーソルを合わせてください。
Tag name タグ名の表示モードを選択します:
Full - タグ名と値を完全に表示します
Shortened - タグ名は3文字に短縮され、タグ値は完全に表示されます
None - タグ値のみを表示し、名前は表示しません
Tag display priority 障害のタグ表示優先順位を、タグのカンマ区切りリストとして入力します(例: customer,scope,component)。値ではなくタグ名のみを使用してください。このリストのタグは、アルファベット順の自然な並びより優先して常に先頭に表示されます。
Show operational data 運用データの表示モードを選択します:
None - 運用データを表示しません
Separately - 運用データを別の列に表示します
With problem name - 運用データを障害名に括弧付きで追加します
Compact view チェックボックスをオンにすると、コンパクト表示を有効にします。
Show details チェックボックスをオンにすると、障害の基になるトリガー式を表示します。Compact view チェックボックスがオンの場合は無効です。
Show timeline チェックボックスをオンにすると、視覚的なタイムラインとグループ化を表示します。Compact view チェックボックスがオンの場合は無効です。
Highlight whole row チェックボックスをオンにすると、未解決の障害について行全体を強調表示します。強調表示には障害の深刻度の色が使用されます。
Highlight whole row は高コントラストテーマでは使用できません。

Zabbix 7.0.19 より前のバージョンでは、このオプションは標準の青テーマおよびダークテーマで Compact view チェックボックスがオンの場合にのみサポートされます。
お気に入りフィルターのタブ

よく使用するフィルターパラメータの組み合わせは、タブとして保存できます。

新しいフィルターパラメータの組み合わせを保存するには、メインタブを開いてフィルター設定を構成し、Save asボタンを押します。 新しいポップアップウィンドウで、Filter propertiesを定義します。

problem\_filter0.png

Parameter Description
Name タブ一覧に表示するフィルター名。
Show number of records タブ名の横に障害の件数を表示したい場合にチェックします。
Override time period selector このフィルターセットに対して特定のデフォルト期間を設定する場合にチェックします。設定すると、このタブの期間はフィルター設定を更新することでのみ変更できます。カスタム期間が設定されていないタブでは、右上隅の期間セレクターボタンを押して期間を変更できます(ボタン名は選択した期間に応じて異なります: This week、Last 30 minutes、Yesterday など)。
このオプションは、Monitoring > Problems のフィルターでのみ使用できます。
From/To 期間 の開始と終了を、絶対時間構文 (Y-m-d H:i:s) または相対時間構文 (now-1d) で指定します。Set custom time period にチェックが入っている場合に使用できます。

保存すると、フィルターは名前付きのフィルタータブとして作成され、すぐに有効になります。

既存のフィルターのフィルタープロパティを編集するには、アクティブなタブ名の横にある歯車アイコンを押します。

problem\_filter2.png

注意:

  • フィルター領域を非表示にするには、現在のタブ名をクリックします。 アクティブなタブ名をもう一度クリックすると、フィルター領域が再び開きます。
  • キーボード操作に対応しています。矢印キーでタブを切り替え、Enter を押して開きます。
  • フィルターの上にある左右ボタンを使用して、保存済みフィルターを切り替えることができます。あるいは、下向きのボタンを押すと、保存済みフィルターがすべて表示されたドロップダウンメニューが開き、必要なものをクリックできます。
  • フィルタータブは、ドラッグ&ドロップで並べ替えることができます。
  • 保存済みフィルターの設定が変更されている(ただし未保存の)場合、フィルター名の後ろに緑色の点が表示されます。 新しい設定に従ってフィルターを更新するには、Save as ボタンの代わりに表示される Update ボタンをクリックします。
  • 現在のフィルター設定はユーザープロファイルに記憶されます。 ユーザーが再度ページを開いたとき、フィルター設定は同じ状態のままです。

フィルターを共有するには、アクティブなフィルターのURLをコピーして他のユーザーに送信します。 このURLを開くと、他のユーザーはこのパラメータセットを自分のZabbixアカウントに永続的なフィルターとして保存できます。
関連項目: ページパラメータ

フィルターのボタン
filter\_apply.png 指定されたフィルタリングを(保存せずに)適用します
filter\_reset.png 現在のフィルターをリセットし、現在のタブに保存されたパラメーターに戻ります。 メインタブの場合はフィルターがクリアされます。
filter\_save\_as.png 現在のフィルタリングパラメーターを新しいタブに保存します。 メインタブでのみ使用できます。
filter\_update.png タブに保存されているパラメータを現在指定されているパラメータに置き換えます。 メインタブでは使用できません。

詳細の表示

監視 > 障害 にある障害の開始時刻と復旧時刻はリンクになっています。 それらをクリックすると、イベントの詳細情報が表示されます。

障害の重大度は、トリガーと障害イベントで異なる場合があることに注意してください。これは、障害の更新 画面 を使用して障害イベントの重大度が更新された場合に発生します。

アクション一覧では、アクティビティの種類を示すために次のアイコンが使用されます。

  • icon\_generated.png - 障害イベントが生成されたことを示します。
  • icon\_message.png - メッセージが送信されたことを示します。
  • icon\_acknowledged.png - 障害イベントが確認済みであることを示します。
  • icon\_unacknowledged.png - 障害イベントが未確認であることを示します。
  • icon\_comment2.png - コメントが追加されたことを示します。
  • icon\_sev\_up1.png - 障害の重大度が上がったことを示します(例: 情報 → 警告)。
  • icon\_sev\_down1.png - 障害の重大度が下がったことを示します(例: 警告 → 情報)。
  • icon\_severity\_back.png - 障害の重大度が変更されたものの、元のレベルに戻ったことを示します(例: 警告 → 情報 → 警告)。
  • icon\_remote.png - リモートコマンドが実行されたことを示します。
  • icon\_recovery.png - 障害イベントが復旧したことを示します。
  • icon\_closed.png - 障害が手動でクローズされたことを示します。
  • icon\_suppression.png - 障害が抑制されたことを示します。
  • icon\_unsuppressed.png - 障害の抑制が解除されたことを示します。
  • icon\_symptom.png - 障害が症状障害に変換されたことを示します。
  • icon\_cause.png - 障害が原因障害に変換されたことを示します。